核糖核酸,通常称为RNA,参与许多生物功能,其中一些,包括基因沉默,被用于治疗疾病。最近,RNA作为一个有前途的药物靶点引起了关注。不幸的是,只有一小部分RNA结构是通过实验确定的,而揭示这些结构的过程需要大量的时间和精力。按照这个时间尺度,许多救命RNA的结构可能需要数年才能被发现。因此,已知RNA种类与可用结构数据之间存在重大差距。研究人员现在已经开发出一种计算解决方案来解决这个问题。
核糖核酸,通常称为RNA,参与许多生物功能,其中一些,包括基因沉默,被用于治疗疾病。最近,RNA作为一个有前途的药物靶点引起了关注。不幸的是,只有一小部分RNA结构是通过实验确定的,而揭示这些结构的过程需要大量的时间和精力。按照这个时间尺度,许多救命RNA的结构可能需要数年才能被发现。因此,已知RNA种类与可用结构数据之间存在重大差距。
普渡大学的研究人员开发了一种名为NuFold的计算解决方案,它将建模3D RNA结构,从而可以提前几十年加速医学发现。研究小组由生物科学和计算机科学教授Kihara Daisuke领导,他们的研究成果发表在自然通讯上。
这一结果具有广泛的潜在应用,例如帮助理解RNA机制和为涉及RNA的疾病开发药物。NuFold的代码和Google Colab笔记本是公开可用的,使其不仅对研究人员可获取,还对任何对RNA结构模型感兴趣的人可用。NuFold是一个突破性的工具,可以更准确有效地预测RNA结构,具有显著推动RNA研究的潜力。
为了维持生命,各种分子需要协同工作。这些分子中的蛋白质通常是研究的主要焦点,但最近发现RNA在基本生命功能中扮演着独特而广泛的角色。为了理解RNA的功能,科学家必须知道其3D结构。
Kihara研究蛋白质三级结构预测/比较、蛋白质-蛋白质对接、蛋白质-配体对接、蛋白质功能预测、蛋白质序列分析,以及代谢/调控途径分析,属于生物科学系的结构生物学小组。他的团队隶属于普渡癌症研究所,并与罗森先进计算中心(RCAC)紧密合作。
“NuFold是RNA的AlphaFold。AlphaFold是计算蛋白质结构预测的方法,获得了2024年诺贝尔化学奖,”Kihara说。“AlphaFold现在被许多生物实验室常规使用。NuFold将是AlphaFold的RNA版本。所以,从某种意义上讲,我们将AlphaFold的突破延伸到RNA世界,这个领域更具挑战性。通过建模RNA的3D结构,我们可以帮助填补实验确定结构缺乏所造成的差距,推动RNA及其在生命与健康中的重要角色的研究。”
“开发NuFold花费了超过三年的时间,”NuFold的主要开发者Yuki Kagaya说道,他是普渡大学的博士后研究助理。“NuFold的一个关键特点是它如何内部表示RNA,考虑对结构至关重要的碱基对,同时准确捕捉RNA固有的灵活性。在基准测试中,NuFold超过了传统的基于能量的方法,并且在局部结构预测中相比于最近的基于深度学习的方法显示出更好的准确性。”
NuFold将帮助研究人员“可视化”RNA结构,并推进与RNA相关的研究进展和药物开发。
“为了解决无法立即通过实验处理的问题,我们开发了NuFold作为一种计算解决方案,”Kihara表示。“NuFold可以通过预测RNA序列的3D结构来填补这一空白。利用最先进的机器学习技术,NuFold可以根据其序列预测RNA的完整原子结构。”
研究作者均隶属于普渡大学。Kihara是第一作者,他构思并指导了这项研究。其他作者包括Kagaya、Zicong Zhang(计算机科学研究生)、Nabil Ibtehaz(计算机科学研究生)、Xiao Wang(前计算机科学研究生)、Tsukasa Nakamura(生物科学博士后)和Pranav Deep Punuru(生物科学本科生)。Kagaya是主要开发者,其余团队成员参与了编码、基准测试和开发Google Colab网络服务器。
“目前的研究是在我们实验室内的团队努力下完成的,汇集了计算机科学和生物学的学生与博士后。研究得到了RCAC、普渡以及NSF XSEDE(现为ACCESS,或先进网络基础设施协调员生态系统)项目的计算资源支持,并得到了Oracle研究云赠款的支持,”Kihara说。
这项工作部分得到了国家卫生研究院(R01GM133840,R01GM123055)和国家科学基金会(CMMI1825941,MCB1925643,IIS2211598,DMS2151678,DBI2003635,以及DBI2146026)的支持。这项工作的一部分计算是在Oracle研究云赠款(CPQ-3035339)以及国家科学基金会资助的极端科学与工程发现环境(XSEDE)支持下进行的,资助编号为ACI-1548562。