新加坡国立大学(NUS)的研究人员推出了一种开创性的方法,用于分析单细胞RNA测序(scRNA-seq)数据。这种新方法旨在提高scRNA-seq数据解读的准确性和速度,这可能显著增强多个生物医学领域的研究,特别是在癌症和阿尔茨海默病研究方面。
这种创新框架被命名为scAMF(通过流形拟合进行单细胞分析),由NUS科学学院统计与数据科学系的副教授姚志刚领导的研究团队创建。该框架应用先进的数学方法,在基因表达数据的复杂高维空间中拟合一个低维流形。通过这样做,scAMF有效地减少了噪音,同时保留了重要的生物信息,从而更准确地识别细胞类型及其状态。
这项研究与清华大学的邱辛通教授合作进行。他们的研究结果于2024年9月3日发表在《美国国家科学院院刊》上。
利用流形拟合技术解决数据分析挑战
单细胞RNA测序是基因组研究中的一项重要工具,能够提供对细胞差异和疾病机制的独特见解。然而,scRNA-seq数据固有的噪声源自生物变异性和技术错误,长期以来一直对准确分析造成困难。传统的scRNA-seq分析技术,如基因组插补、基于图方法和深度学习算法,常常由于噪声而难以划分细胞关系。
scAMF框架在解决这些挑战方面标志着一个重要的进展。它的基本原理是在基因表达数据的环境空间中拟合一个低维流形,有效地减少噪音,同时保留关键的信息。scAMF的核心是一个流形拟合模块,通过展开其在环境空间中的分布来去噪声scRNA-seq数据。此方法旨在重建原始测量空间中的光滑流形,以捕捉低维结构,从而最小化数据损失并有效减轻噪音。
scAMF的主要创新在于它能够增强数据的空间排列,将相似细胞类型的基因表达向量聚集在一起,同时确保不同细胞类型之间的明显区分。这一改进使后续分析中的聚类更加准确和可靠。
“我们的方法通过在高维空间中拟合一个低维流形,有效地减少了scRNA-seq数据中的噪音,”姚副教授说。“这种方法显著提升了细胞类型分类的准确性,提高了数据可视化的清晰度。”
scAMF方法采用了独特的数据转换、通过共享最近邻度量进行的流形拟合以及无监督聚类的验证。在与其他技术比较时,scAMF在几个重要领域表现出色,如更有效的噪声减少、增强的聚类准确性、优越的生物数据保留、竞争性的计算效率、更清晰的可视化表示以及在各种数据集上的一致性能。这些进展使scAMF成为单细胞分析中的一项强大工具,有可能使研究人员揭示以前隐藏的细胞多样性和稀有细胞群体。
未来的努力——推进对细胞多样性和功能的理解
在scAMF取得成功后,研究团队现在专注于开发一个新的框架,以创建高分辨率的多尺度细胞图谱。这种更新的方法旨在克服构建细胞图谱中的当前挑战,例如识别小细胞群体的困难和过时的无监督学习方法。
一个重要的重点是创建一个基于scAMF的多分辨率细胞分析框架。这个先进的框架旨在识别稀有细胞群体,并促进详细细胞图谱的开发。多分辨率策略将使研究人员能够在不同的深度层次上检查细胞多样性,从广泛的细胞类别到微妙的亚群体。这一能力对于检测可能被传统分析技术遗漏的稀有细胞类型至关重要。
“我们的持续研究已经在众多基准数据集上取得了可喜的成果,导致了新的生物发现,”姚副教授指出。“我们已经将其应用于人类大脑细胞图谱,发现了不同细胞类型的新亚型和标记基因。”
这一持续的研究有可能进一步拓展单细胞分析的视野,有可能改变我们对多种生物系统中细胞多样性和功能的理解。