俄捷斯金 vs. 格雷茨基:周三进球后,NHL得分头衔的倒计时开始

Ovechkin vs. Gretzky: With goal Wednesday, countdown starts for NHL scoring title The countdown is on with Alex Ovechkin just 10 goals from overtaking Wayne Gretzky as the NHL's career goal leader – a mark that once seemed unsurmountable and earned Gretzky the nickname The Great One. The Great Eight, as the Washington Capital is
健康剖析基因突变对疾病的影响

剖析基因突变对疾病的影响

人类基因组的完整测绘为研究人员提供了详细的DNA框架,允许识别与各种疾病相关的基因区域和变异。虽然传统的统计方法在找到这些基因“针”方面有效,但它们难以澄清与糖尿病和精神分裂症等疾病相关的基因数量。奥地利科学与技术研究所(ISTA)进行的一项新研究旨在解决这个问题,发表在《PNAS》上。

人类基因组的完整测绘为研究人员提供了详细的DNA框架,允许识别与各种疾病相关的基因区域和变异。虽然传统的统计方法在找到这些基因“针”方面有效,但它们难以澄清与糖尿病和精神分裂症等疾病相关的基因数量。奥地利科学与技术研究所(ISTA)进行的一项新研究旨在解决这个问题,发表在《PNAS》上。

许多用于研究的统计模型和算法可以被视为“黑箱”。这些模型提供准确的预测,但其内部过程往往不易解读。在深度学习能够分析大量数据的时代,物理学家和ISTA的博士生Natália Ružičková决定采取不同的方法,特别是关于基因组数据分析。

与最近的ISTA毕业生Michal Hledík和Professor Gašper Tkačik一起,Ružičková提出了一种旨在研究“多基因疾病”的模型,涉及多个基因区域共同导致某种疾病。该模型通过将先进的基因组分析与基本生物学原理结合,有助于澄清某些基因组区域为何与这些疾病相关。研究结果发表在《PNAS》上。

解码人类基因组

人类基因组计划于1990年开始,2003年完成,成功解码人类DNA——人类的遗传蓝图。这一成就促进了科学、医学和技术的众多进展。通过解释人类基因组,科学家希望更好地理解与特定突变和变异相关的疾病。考虑到人类基因组包含约20,000个基因,以及更多的碱基对(构成蓝图的字母),强有力的统计方法成为必要。这导致了“全基因组关联研究”(GWAS)的创建。

GWAS研究与身高等特征相关的潜在遗传变异,以及各种疾病的可能性。统计方法相对简单:研究参与者被分为两组——健康个体和患病个体。分析他们的DNA,以识别在患病者中更常见的变异。

基因的相互作用

当GWAS首次被引入时,科学家们预计会发现几个已知基因中的突变,与特定疾病相关,能够解释健康与生病个体之间的差异。然而,现实情况更为复杂。“通常,与特定疾病相关的突变数量达到数百甚至数千个,”Ružičková表示。“这一发现令人惊讶,且与我们之前的生物学理解相矛盾。”

单独来看,每个突变对疾病风险的贡献微乎其微,但它们结合在一起能够更好地解释为何某些人会发展成疾病。这些疾病被归类为“多基因”疾病。例如,2型糖尿病是多基因疾病,因为它不是由单一基因引起,而涉及多个突变。其中一些突变影响胰岛素生成、胰岛素作用或葡萄糖代谢,而许多其他突变发生在之前与糖尿病无关的基因组区域或其功能仍不清楚的区域。

全基因模型

2017年,Stanford大学的Evan A. Boyle及其同事提出了“全基因模型”,为众多基因对疾病的贡献提供了理论基础。该模型建议基因是调控网络的一部分,这些网络将具有不同功能的基因连接起来。

“基因是相互联系的,因此一个基因中的突变可以影响其他基因,因为突变效果通过调控网络传播,”Ružičková解释道。这种相互联系意味着在调控框架内的众多基因可能最终对疾病产生影响。然而,该模型尚未得到数学形式化,仍然主要是概念性的,且难以测试。在他们最近的论文中,Ružičková和她的团队介绍了一种基于全基因模型的新的数学结构,称为“定量全基因模型”(QOM)。

结合统计与生物学

为了展示他们新模型的能力,研究人员将其应用于一个研究较多的生物系统:常见实验室酵母,Saccharomyces cerevisiae,也称为酿酒酵母面包酵母。作为单细胞真核生物,酵母的细胞结构与更复杂的生物体(如人类)相似。“在酵母中,我们对调控网络如何连接基因有很好的理解,”Ružičková指出。

利用他们的模型,研究人员预测基因表达水平——基因活动的程度,并追踪突变如何穿越酵母的调控网络。他们的预测证明是非常有效的,准确识别相关基因,并具体说明哪些突变可能对某些结果产生影响。

多基因疾病的拼图

科学家的目标并不是超过标准GWAS的预测性能,而是创造一个可解释的模型。虽然传统GWAS作为“黑箱”运作,仅仅估计突变与疾病的关联频率,但他们的新模型也澄清了连接突变与疾病的因果路径。

对生物学背景和因果路径的理解在探索新的治疗途径时至关重要。尽管该模型距离立即的医学应用尚远,但其前景仍然乐观,特别是在增强对多基因病的理解方面。“在对调控网络有足够了解的情况下,类似的模型可以应用于其他生物体。我们对酵母中基因表达的探索仅仅是初步的步骤和原则的演示。凭借这些知识,我们可以开始考虑在人体遗传学的应用,”Ružičková表示。