基因组编辑迅速发展,治疗遗传病取得了有希望的结果——但仍有改进的空间。来自麻省总医院布莱根妇女医院的研究人员发表在《自然》杂志上的一篇新论文展示了可扩展蛋白质工程与机器学习的结合在基因和细胞疗法领域推动进展的强大能力。在他们的研究中,作者开发了一种名为PAMmla的机器学习算法,能够预测大约6400万种基因组编辑酶的特性。这项工作可能有助于减少非靶向效应,提高编辑安全性,增强编辑效率,并使研究人员能够预测用于新治疗靶点的定制酶。其结果已发表在《自然》杂志上。
“我们的研究是大幅度扩展有效且安全的CRISPR-Cas9酶的第一步。在我们的手稿中,我们展示了这些PAMmla预测酶在原代人类细胞和小鼠中精确编辑导致疾病的序列的实用性,”主要作者本·克莱因斯提弗(Ben Kleinstiver),麻省总医院(MGH)凯登-兰伯特研究奖学金副研究员表示,“基于这些发现,我们期待这些工具被社区使用,并将这一框架应用于基因组编辑工具箱中的其他特性和酶。”
CRISPR-Cas9酶可以在基因组的各个位置编辑基因,但这项技术仍有限制。传统的CRISPR-Cas9酶可能会出现非靶向效应,在基因组中的意外位置切割或以其他方式修饰DNA。新发表的研究旨在通过使用机器学习更好地预测和定制酶,以提高特异性,从而改善这一点。这种方法还提供了一种可扩展的解决方案——其他对酶的工程尝试具有较低的通量,通常产生的酶数量少了几个数量级。
使用CRISPR-Cas9技术的关键要素之一是,酶必须定位并结合到称为“邻近基序”的短DNA序列(PAM)。研究人员使用机器学习预测了数百万种Cas9酶的PAM,确定了一组具有最佳靶向活性和特异性的全新工程Cas9酶。研究人员在人体细胞和视网膜色素变性小鼠模型中进行了概念验证实验,发现定制酶具有更高的特异性。
“这项工作的一个主要成果是创建了这个PAMmla模型,研究人员现在可以利用它来预测专门针对其特定用例量身定制的酶,” 首席作者、麻省总医院克莱因斯提弗实验室的博士生雷切尔·A·西尔弗斯坦(Rachel A. Silverstein)表示,“该模型的结果是我们现在拥有一个巨大的安全且精确的Cas9蛋白工具箱,可以用于各种研究和治疗应用。”
研究人员已经制作了一个网络工具,允许其他人使用PAMmla模型,网址为https://pammla.streamlit.app/。