现在已经为六种猿类物种组装了综合参考基因组:白手猿(东南亚的长臂猿)、苏门答腊猩猩、婆罗洲猩猩、 gorilla、倭黑猩猩和黑猩猩。由于结构复杂性,之前无法访问的基因组区域现在大部分已得到解决。该资源现已适用于比较研究,提供了关于人类和猿类进化的新见解,以及揭示这些物种之间功能差异的基础。
现在已经为六种猿类物种组装了综合参考基因组:白手猿(东南亚的长臂猿)、苏门答腊猩猩、婆罗洲猩猩、 gorilla、倭黑猩猩和黑猩猩。由于结构复杂性,之前无法访问的基因组区域现在大部分已得到解决。
该资源现已适用于比较研究,提供了关于人类和猿类进化的新见解,以及揭示这些物种之间功能差异的基础。
关于如何开发端粒到端粒的猿基因组参考,以及科学家们从中学到的内容的报告,出现在《自然》杂志4月9日的版面上。
该国际多机构项目的高级研究人员和通讯作者包括华盛顿大学医学院基因组科学教授、霍华德·休斯医学研究所的研究员Evan E. Eichler;宾州州立大学生物系的Kateryna D. Makova;以及美国国立卫生研究院国家人类基因组研究所的Adam M. Phillippy。第一作者是Eichler实验室的博士后研究员DongAhn Yoo。
“这些猿类基因组将使我们能够重建我们基因组中每个碱基对的进化历史,”Eichler说。
他将该项目描述为一个庞大的团队合作,来自全球40多家研究实验室的120多名科学家共同努力,花费数年时间组装、质量控制和分析这些基因组。
该项目的科学家们估计,每个最近的基因组组装都超过99%得到了解决,包括最难处理的部分。这些精致的版本显著提高了之前猿类基因组组装的测序准确性,且与最新的人类基因组参考质量相当。这消除了某些之前比较中存在的偏见,在这些比较中,人类基因组组装总是更为优越。
研究人员还构建了一个10种基因组的泛基因组,以比较这六种猿类基因组和四个人类基因组,并附有一个种间图。
最新发现揭示了人类和猿类在免疫系统、寿命和大脑发展等领域的一些遗传差异。这些知识可能在衰老、语言习得、神经精神病学和免疫学等生物医学领域具有相关性。
类似人类的猿类大约在550万到630万年前与黑猩猩分开。黑猩猩与倭黑猩猩是我们最近的活体灵长类家属。广泛报道表明,黑猩猩和人类的基因组共享99%,但深入的比较指向微妙的差异。这些可能有助于解释为什么黑猩猩和人类并没有更像。这两种物种的基因组并不完全对齐,特别是在某些区域。
非洲猿类是我们在灵长类祖先树上最接近的亲属,大约在1060万到1090万年前分化,而猩猩大约在1820万到1960万年前分化。新的猿基因组资源在分析猿类物种形成机制方面正在发挥作用——即新物种是如何从现有物种中演化而来的——并质疑关于各种猿类物种如何形成的主流观点。
对猿类参考基因组的其他探索导致了意外的发现,可能具有治疗意义。例如,倭黑猩猩中进化出的小得多但功能完全的着丝粒(参与控制细胞分裂)可能为设计简化的人造染色体以传递遗传信息到人类细胞以治疗或预防疾病提供了思路。
在对猿基因组的额外分析中,科学家系统性地确定每种灵长类物种中进化最快的区域。这些区域具有加速突变率,通常与特定于某一物种的新基因的出现相关。
结构多样性和基因丰富的区域之一是主要组织相容性复合体。这是一个巨大的基因簇,编码细胞表面蛋白,使身体的免疫系统能够区分无害的自我和潜在有害的入侵者。该区域在哺乳动物之间有很大差异。当与人类基因组比较时,该区域表明,古老的物种特异性差异可能是理解影响只有人类的多种疾病的关键。
在考察类人猿遗传多样性时,研究人员寻找地域适应的基因标记。除了在免疫功能和外皮形成相关区域的富集外,还有与大脑发展和饮食相关的路径。这些包括感知苦味的味觉、分解脂肪和油脂的脂质以及体内铁的转移。
对进化基因组科学家称之为“祖先快速进化区域”的评估发现,这些区域在人的数量上超过了以前发现的两倍。通常,但并非总是,这些区域以高度重复的DNA为特征。
这类区域的一个例子是与一种在与言语相关的脑区中发现的脑细胞类型相关的基因,该区域位于运动皮层。这个基因类似于在鸣禽的发声学习中心中起作用的基因,并控制歌曲的产生。人类在这个人类祖先快速进化区域的中间有一个独特的遗传控制元件。
对人类和猿类进化研究特别感兴趣的是被称为片段重复的DNA代码中的重复序列。早期基因组测序研究未能全面表征这些区域。长读长测序技术的进步首次使这些区域变得可访问。
片段重复是基因创新起源的方式之一。它们在猿类之间的遗传变异中发挥重要作用,包括大部分染色体的剧烈重构。
片段重复在某些类型的染色体的短臂中富集,这些染色体是非中位的连接,因此其臂的长度不同。这些所谓的亚中心染色体的例子包括染色体13、14、15、21和22。
亚中心染色体在其他方面也很少见,这些方面为猿类物种之间的差异做出了贡献。与其他染色体相比,这些亚中心染色体的短臂上有过量的重复序列和重组。
研究人员解释说,猩猩比其他猿类拥有更多的亚中心染色体。在与非洲大猿类的比较中,它们也具有最多的片段重复。黑猩猩、倭黑猩猩和大猩猩,但白手猿除外,拥有比人类和其他灵长类更多的片段重复。
研究人员首次能够在其DNA基本构建块的水平上研究着丝粒区域的遗传序列、结构和进化:碱基对。他们还报告了黑猩猩和倭黑猩猩在着丝粒结构和大小方面的差异。倭黑猩猩和黑猩猩在大约180万年前分化,它们在刚果河地理上分开并各自沿自己的进化路线发展。尽管倭黑猩猩的着丝粒明显小于黑猩猩,但它们的功能正常。
更一般地说,分析片段重复可以使科学家确定哪些是特定于每个猿类物种的谱系。当使用新资源时,研究人员正在尝试通过位置和组成来理清与每个物种相关的片段重复。
“我们现在拥有一个理解高度不同、以前无法接触的猿基因组区域的进化框架,”研究人员在其《自然》论文中写道。这样的研究还揭示了容易被重新排列的基因组结构。
科学家指出:“片段重复重排可能是比之前认识的更大的物种间差异和潜在基因新功能化的来源。”
大多数进化生物学家认为,区分人类与黑猩猩的差异起源于调控——即高度保守基因表达的时间和位置的微小变化。猿类基因组参考提供了一个新模型。
“我们正在发现成百上千个嵌入在这些片段重复中的蛋白编码基因,这些基因对于每个猿类物种都是独特的,”Eichler说。“其中一些已经被证明有助于使我们独特的人类变化,例如更大的大脑。”
新结果表明,猿类之间存在更多的编码蛋白差异。
获取更多关于片段重复重排的信息可能帮助研究人员在确定人类某些疾病(例如发育迟缓、智力障碍和自闭症特征)源于可能以这种方式形成的新突变方面取得进展。
尽管他们认为猿基因组样本几乎已完全完成,科学家们表示,仍有工作要做,包括填补一些最后剩余的复杂缺口。此外,大约15种猿类及其亚种仍需进行基因组测序并添加到参考资源中。
科学家们表示,他们还希望消除基因注释中的偏见,消除对人类的偏爱。将基因映射到基因组序列并预测功能基因是具有挑战性的。然而,研究一直受到对潜在重要但研究较少的基因的忽视所阻碍。