修饰蛋白质以增强对结合亲和力和特异性的控制能力,促进了定制治疗药物的开发,这些治疗药物副作用更少,诊断设备高度敏感,生物催化剂有效,靶向药物递送系统,以及环保的生物修复策略。然而,现有的蛋白质重设计策略面临冗长且繁琐的挑战。现在,研究人员推出了一种名为ProteinReDiff的简化技术,该技术利用人工智能加速小分子结合蛋白的重新设计过程。
细胞蛋白质与被称为配体的分子相互作用,这一过程支持生命的许多重要功能,如细胞信号传导和酶活性。在生物技术和医学领域,如果研究人员能够修饰蛋白质以增强其结合亲和力和特异性,这将导致个性化疗法的出现,副作用最小化,高度响应的诊断工具,有效的生物催化,靶向药物递送系统,以及环保的污染清理解决方案。
不同的蛋白质重设计方法存在一定的局限性。传统方法通常依赖于缓慢的试错技术,而许多计算设计框架需要关于蛋白质结构和配体结合位点的详细信息。
由阿拉巴马大学伯明翰分校的Truong Son Hy博士领导的研究团队推出了一种更简单的技术,称为ProteinReDiff,该技术应用人工智能加快小分子结合蛋白的重新设计过程。
“我们的框架能够在不需要详细结构数据的情况下创建高亲和力的配体结合蛋白,”UAB计算机科学系助理教授Hy解释道。“我们仅依赖原始蛋白质序列和配体SMILES字符串。”
SMILES,或简化分子输入线条录入系统,是一种长期存在的方法,仅使用可被计算机解释的ASCII字符来描述分子的结构。
Hy表示:“我们技术的一个重要方面是盲对接,旨在估计重新设计的蛋白如何与其配体相互作用,而无需预先设定关于结合位点的信息。这个高效的方法大大降低了对详细结构知识的依赖,拓宽了基于序列探索蛋白-配体相互作用的潜力。”
研究团队,包括来自越南胡志明市FPT软件人工智能中心的Viet Thanh Duy Nguyen和来自芝加哥大学的Nhan D. Nguyen,使用众多已知蛋白质结构及其相应的配体训练了ProteinReDiff人工智能框架。他们通过随机改变氨基酸和去噪扩散模型,创造性地重新设计特定的蛋白-配体对,以准确描绘配体和蛋白复合物的联合分布。
Hy及其合作者在评估ProteinReDiff时,将其与其他八个计算蛋白设计模型进行了比较,主要关注从选定的配体-蛋白对中增强配体结合的输入和输出特征。
在输入特征方面,八个对比模型中有六个纳入了蛋白质的结构数据,而只有ProteinReDiff和另一个称为DPL的模型纯粹依赖于蛋白质序列和配体SMILES输入。关于输出,只有ProteinReDiff产生了新的蛋白质设计,包括蛋白质序列、结构和配体结构。
在性能评估方面,由ProteinReDiff生成的选定配体-蛋白配对的重新设计蛋白,在配体结合亲和力、氨基酸序列的多样性以及结构完整性方面,与其他蛋白设计模型的结果进行了比较。ProteinReDiff显示出比其同类模型更高的配体结合亲和力。
Hy表示:“我们的模型通过仅使用蛋白质的初始序列和配体SMILES字符串来提升配体结合亲和力,避免了详细结构数据的必要性。这些结果揭示了为建模蛋白-配体复合物所开辟的新机会,展示了ProteinReDiff在各种生物技术和制药行业的巨大潜力。”
ProteinReDiff代表基于扩散模型的蛋白质重设计。它实施了受AlphaFold2架构启发的表示学习元素的重要增强,这一架构用于计算机基础的蛋白质折叠。这些增强使ProteinReDiff框架能够准确捕捉复杂的蛋白-配体相互作用,提高结合亲和力预测的准确性,并促进更精确的配体结合蛋白的重新设计。