基因治疗有潜力治疗遗传性疾病,但安全有效地将新基因递送到特定细胞仍然很具挑战性。目前用于修改最广泛使用的基因递送系统腺病毒相关病毒(AAV)的技术往往速度慢且效果不佳。不过,研究人员引入了一种机器学习技术,可能会增强AAV在基因治疗中的工程过程。
基因治疗对治愈遗传性疾病充满希望,但安全高效地包装和递送新基因到特定细胞仍然困难。现有的用于工程化腺病毒相关病毒(AAV)的技术,这是一种常见的基因递送载体,通常缺乏速度和效率。
来自麻省理工学院和哈佛大学的布洛德研究所的研究人员创造了一种机器学习工具,旨在加速用于基因治疗的AAV的工程化。该工具帮助研究人员修改AAV的蛋白外壳,称为囊膜,使其具备多个理想特性,如递送遗传物质到特定器官的能力,同时避免其他器官,或在不同物种中具有功能。传统方法通常是基于一次一种特征来识别囊膜。
团队应用他们的技术为一种常用的AAV类型AAV9设计囊膜,该类型更有效地针对肝脏且易于制造。大约90%的囊膜建议来自他们的机器学习模型成功递送其遗传货物到人类肝细胞,并满足五个额外标准。此外,他们的模型准确预测了猕猴中蛋白质的行为,尽管仅用小鼠和人类细胞的数据进行训练。这表明新方法可能有助于加速设计在不同物种中有效的AAV,这是推动人类应用基因治疗的重要一步。
这些发现最近发表在《自然通讯》上,来自于布洛德的本·德弗曼实验室,他是该研究所的科学家和斯坦利精神研究中心的载体工程主任。德弗曼团队的高级机器学习科学家法特玛-埃尔扎赫拉·艾德是该研究的第一作者。
德弗曼表示:“这确实是一个独特的方法。它强调了从一开始,在湿实验室生物学家与机器学习专家之间协作的重要性,以创造出能产生适合机器学习的数据的实验,而不是事后考虑。”
该小组的领导Ken Chan、研究生Albert Chen、研究助理Isabelle Tobey和科学顾问Alina Chan也做出了贡献,他们都来自德弗曼的实验室。
拥抱技术
传统的AAV设计方法通常涉及生产包含数百万种囊膜蛋白变体的大型库,随后在细胞和动物中进行广泛的测试,经历多个选择阶段。这个程序既昂贵又耗时,通常只能产生少数具有特定特征的囊膜。因此,发现同时满足多个标准的囊膜非常具有挑战性。
尽管其他研究人员利用机器学习进行大规模评估,但许多方法通常优化蛋白质以满足一种功能,往往会牺牲其他功能。
德弗曼和艾德认识到,现有的来自大型AAV库的数据集不适合训练机器学习模型。“我们问自己,‘我们需要什么来增强我们的模型训练?’”艾德解释说。“确定这一点至关重要。”
他们首先利用初步的机器学习建模创建了一个新的中等规模库,称为Fit4Function,其中包括预计能有效包装基因货物的囊膜。该团队在人体细胞和小鼠中评估了该库,以识别出在每种物种中为基因治疗显示特定功能的囊膜。他们随后将这些数据汇总,开发多个能够预测囊膜氨基酸序列中不同功能的机器学习模型。这些模型最终结合,建立了优化多个特征的“多功能”AAV库。
蛋白质工程的前景
作为概念验证,艾德和德弗曼实验室的同事结合六个模型创建了一个囊膜库,展示多个所需功能,如易于制造和能在人体细胞和小鼠中靶向肝脏。令人印象深刻的是,这些蛋白质中有90%同时展现了所有所需特性。
此外,研究人员指出,他们的模型仅基于小鼠和人类细胞的数据,准确预测了AAV在猕猴不同器官中的分布,表明这些AAV通过在不同物种中有效的机制运作。这可能导致未来基因治疗研究人员能够更迅速地识别出具有各种有益特性的囊膜供人类使用。
展望未来,艾德和德弗曼提议,他们的模型可能帮助其他团队设计能特定靶向或避免肝脏的基因治疗。他们还期望其他研究机构采用他们的方法,建立自己的模型和库,潜在地创建一个机器学习图谱——一个能够预测AAV囊膜性能的资源,促进基因治疗进展。