最近,克利夫兰诊所和IBM的研究人员在《化学理论与计算杂志》上发表了一项研究。这项研究可能是使用量子计算技术进行蛋白质结构预测的重要一步。这标志着克利夫兰诊所与IBM发现加速器合作伙伴关系的第一篇经过同行评审的量子计算论文。
科学家们长期以来一直使用计算方法来预测蛋白质结构。
蛋白质结构对于确定蛋白质如何在体内发挥功能以及与其他分子的相互作用至关重要。这些结构在人体健康和疾病中发挥着关键作用。
准确预测蛋白质的结构可以帮助研究人员更好地理解疾病是如何传播的,并开发更有效的疗法。克利夫兰诊所的博士后研究员布赖恩·劳本霍特(Bryan Raubenolt)和IBM的研究员哈坎·多加(Hakan Doga)领导了一个团队,探索量子计算如何增强当前的方法。
近年来,机器学习技术在预测蛋白质结构方面取得了重大进展。这些方法依赖于使用训练数据,即实验确定的蛋白质结构数据库来进行预测。这意味着他们的预测受到他们被训练识别的蛋白质数量的限制。当程序或算法遇到突变或与他们被训练的蛋白质非常不同的蛋白质时,这种限制可能会导致准确性降低,而这在遗传疾病中很常见。
另一种方法是使用模拟来模拟蛋白质折叠的物理过程。模拟使研究人员能够探索给定蛋白质的各种潜在形状,并识别最稳定的形状。最稳定的形状对于药物设计至关重要。问题是,一旦目标蛋白质达到一定大小,使用经典计算机运行这些模拟几乎变得不可能。根据劳本霍特博士的说法,这就像试图解决一个更大的魔方——对于一个有100个氨基酸的小蛋白质,经典计算机需要花费不可能的长时间来探索所有潜在的结果。为了解决这些限制,研究团队结合了量子和经典计算方法。这种方法可以使量子算法解决一些具有挑战性的领域。对先进经典计算技术的探索涵盖了多种因素,如蛋白质大小、内在无序、突变以及涉及蛋白质折叠的物理学。通过在量子计算机上准确预测寨卡病毒蛋白质小部分的折叠,相较于最先进的经典方法,验证了该框架的有效性。
量子-经典混合框架的初步结果超越了经典物理方法和AlphaFold2的结果。尽管AlphaFold2专门针对较大的蛋白质设计,但这仍然证明了该框架能够在没有极端限制的情况下生成准确的模型。
研究人员在很大程度上依赖于大量训练数据。
他们利用量子算法最初模拟片段骨架的最低能量构型,这通常是计算过程中最具挑战性的步骤。然后采用经典方法来解释量子计算机的结果,重建带有侧链的蛋白质,并利用经典分子力学力场微调结构。这个项目展示了如何将问题分解为组成部分,利用量子计算技术处理某些部分,而经典计算则处理其他部分。
提高精度一直是项目的关键焦点。
劳本霍特博士强调了该项目的独特性,表示:“这个项目最独特的地方之一是涉及了多个学科。我们团队的专业知识涵盖计算生物学、化学、结构生物学、软件和自动化工程、实验原子和核物理学、数学,以及量子计算和算法设计。各个领域知识的协作对创建一个能够模拟对人类生命至关重要的过程的计算框架至关重要。”
该团队同时利用经典和量子计算方法标志着我们对该主题理解的重大进步。研究的重点是蛋白质结构的预测以及它们如何影响疾病的治疗和预防。该团队旨在继续开发和改进能够预测更复杂蛋白质结构的量子算法。
多加博士表示:“这项研究代表了探索量子计算在预测蛋白质结构方面潜在能力的重大进展。我们的目标是创建能够准确预测蛋白质结构的量子算法。”