卡内基梅隆大学计算机科学学院的研究人员在理解人类基因组在单个细胞内的组织方面迈出了重要的一步。这一理解对于研究DNA结构如何影响基因表达和疾病过程至关重要。研究结果发表于《自然方法》期刊。马健及前博士生肖凯和张若琪开发了一种名为scGHOST的机器学习方法。该方法可以检测子区间,这是一种细胞核内特定类型的三维基因组特征,并将它们与基因表达模式联系起来。
在人类细胞中,染色体并不是以线性方式排列的。而是折叠成三维结构。研究人员尤其对三维基因组子区间感兴趣,因为它们揭示了染色体在细胞核内的空间位置。
单细胞生物学的最终目标是理解这些三维基因组结构与基因表达模式之间的联系。马说:“细胞的结构和功能在不同的生物学情况下差异很大。我们正在研究细胞核内染色体的组织如何与基因表达相关。”
新技术使得在单细胞水平上研究这些结构成为可能,但数据质量差可能使得准确理解它们变得困难。为了解决这个问题,scGHOST使用基于图形的机器学习来改善数据,使染色体的空间组织更容易确定和识别。scGHOST基于马的研究小组开发的Higashi方法。
通过准确识别3D基因组结构,一种名为scGHOST的新工具被开发出来,帮助科学家分析单细胞及组织复杂的分子组成,特别是在大脑中。该工具主要集中在识别单细胞三维基因组子区间,预计将为健康和疾病中的基因调控提供宝贵的见解。