一种新鲜的蛋白质工程模型训练方法的关键突破,称为EvoRank,围绕着利用数百万种经过长期进化形成的蛋白质的自然多样性。这种方法提取了实现生物技术挑战的实际解决方案所需的关键动力学。
德克萨斯大学奥斯汀分校的研究人员创造了一种新的人工智能模型,这为改善和减少有害医疗治疗以及新的预防方法铺平了道路。该人工智能模型通过借鉴自然进化历史提供的逻辑框架,帮助设计基于蛋白质的疗法和疫苗。
这一名为EvoRank的人工智能创新,是人工智能如何推动生物医学研究和生物技术整体变革的一个重要例子。科学家们在国际机器学习大会上展示了他们的研究成果,并讨论了一篇有关利用更广泛的人工智能框架来 pinpoint 蛋白质中有益突变的相关论文,发表在《自然通讯》上。
在创建增强蛋白质基础的生物技术时,一个重要的挑战是缺乏足够的实验数据来正确训练人工智能模型。这些模型需要理解蛋白质的特定功能,以便为特定应用对其进行工程设计。EvoRank的关键思想是利用数百万种由进化产生的自然变异,并提取出有助于生物技术问题可行解决方案的关键动力学。
“自然已经对蛋白质进行了超过30亿年的精炼,通过突变或替换氨基酸,并保留那些对生物体有益的突变,”德克萨斯大学计算机科学研究员、深度蛋白质小组的共同负责人Daniel Diaz说。该小组由计算机科学和化学的专家组成。“EvoRank学习评估我们今天观察到的进化,实质上提炼出控制蛋白质进化的原则,并运用这些原则来指导新型基于蛋白质的应用的创造,包括药物开发、疫苗和各种生物制造任务。”
德克萨斯大学拥有全国顶尖的人工智能研究项目之一,并拥有国家科学基金资助的机器学习基础研究所(IFML),该所由计算机科学教授Adam Klivans领导,他也是深度蛋白质小组的共同负责人。最近,健康高级研究项目局向深度蛋白质团队和疫苗研究员Jason McLellan(德克萨斯大学分子生物科学教授)颁发了近250万美元的赠款,与拉荷亚免疫学研究所联合进行合作。这笔资金将使德克萨斯大学团队能够将人工智能应用于蛋白质工程研究,旨在开发对抗疱疹病毒的疫苗。
“创造具有自然蛋白质所不具备的功能的蛋白质是生命科学中的一个持续重大挑战,”Klivans解释道。“这个任务与生成性人工智能模型的优势完全契合,因为它们能够合成已知生物化学的广泛数据库,然后产生新设计。”
与谷歌DeepMind的AlphaFold不同,后者利用人工智能根据氨基酸序列预测蛋白质的形状和结构,深度蛋白质小组的人工智能系统则专注于建议对蛋白质进行最佳修改,以增强特定功能,如改善蛋白质研发出新的生物技术。
麦克莱伦的实验室已经根据人工智能的设计生成了各种病毒蛋白的版本,并正在评估它们的稳定性及其他特性。
“这些模型提出的替代方案是我们最初不会考虑的,”麦克莱伦表示。“它们是有效的,但并不是我们会做出的预测,这意味着它们正在发现稳定性的新解决方案。”
蛋白质疗法通常比其他选项带来较少的副作用,并且可能更安全、更有效,当前全球市场估计为4000亿美元,预计在下一个十年将增加50%以上。然而,开发基于蛋白质的药物的过程往往缓慢、昂贵,且风险重重。从药物设计到完成临床试验可能需要十年或更长时间,成本超过10亿美元,即便如此,获得FDA批准的机会也只有大约十分之一。此外,为了在治疗上可行,蛋白质通常需要进行基因修改以确保稳定性或满足药物研发所需的产量水平,这通常需通过繁琐的试错方法在实验室中确定。
如果EvoRank及其相关的德克萨斯大学开发的框架Stability Oracle获得商业应用,行业可以显著减少与药物开发相关的时间和成本,同时为加速改进设计的创造提供路线图。
通过利用现有的自然蛋白质序列数据库,EvoRank的创造者将不同的同种蛋白质在不同生物中的变体进行了对齐比较——从海星到橡树再到人类。在蛋白质的任何特定位置,可能存在几种不同的氨基酸,而进化认为这些是有益的。其中,自然经常选择酪氨酸,选择概率为36%,组氨酸29%,赖氨酸14%——关键是,*从未*选择亮氨酸。这大量的现有数据揭示了蛋白质进化的基本逻辑。研究人员可以利用这些信息,消除进化所认为会妨碍蛋白质功能的选项,以训练新的机器学习算法。该模型通过持续反馈学习,理解在蛋白质进化过程中自然历史上倾向于的氨基酸,以及自然中可能的组合。
接下来,Diaz旨在开发一个“多列”版本的EvoRank,可以同时评估多个突变对蛋白质结构和稳定性的影响。他还希望创建新的工具,以预测蛋白质的结构与其功能的关联。
除了Klivans和Diaz,计算机科学研究生Gong Chengyue和德克萨斯大学校友James M. Loy共同撰写了这些研究。Tianlong Chen和Qiang Liu是EvoRank的贡献者,而Jeffrey Ouyang-Zhang、David Yang、Andrew D. Ellington和Alex G. Dimakis则协助进行了Stability Oracle的研究。该研究获得了国家科学基金、国防威胁减少局和Welch基金会的资助。