一项最新研究表明,长读长测序可以提高遗传疾病诊断的速度和有效性,将诊断所需的时间从数年缩短到仅几天—所有这些都可以通过一项测试并以更低的费用完成。
全球大约十分之一的人口患有罕见遗传病,这些病例中近一半未得到诊断,尽管在遗传技术和检测方面取得了进展。获得检测并不保证及时的诊断;这一过程可能延续超过五年或更长时间。对于可能需要紧急治疗的儿童来说,这种延迟可能是至关重要的。
问题在于目前临床实践中使用的短读测序,无法捕捉特定基因组区域的信息,可能忽略重要的诊断线索。来自加州大学圣克鲁兹分校的研究人员正在推进一种被称为长读测序的有前途的替代方案,提供更全面的数据集,以识别遗传变异,减少多次专业检测的需求,并简化诊断罕见疾病的过程。
发表在《美国人类遗传学杂志》上的研究结果表明,长读测序可以显著提高诊断率并缩短获得诊断的时间,这一切只需通过一项测试,且费用远低于以往。这项研究由UCSC基因组研究所的关键成员主导,包括本尼迪克特·帕滕教授、卡伦·米加副教授和前博士后研究员让·蒙朗。
“诊断罕见疾病一直是一大挑战,而拥有一种简化这一过程的测序技术可能是一项巨大的进步——这正是我们在本研究中探索的内容,”加州大学圣克鲁兹分校的博士生和论文的首位作者什洛卡·内吉解释道。
“目前,遗传测序在诊断方面的成功率相当不令人满意,”帕滕表示。“一个重要的问题可能是临床环境中使用的不完整测序方法。在这项调查中,我们测试了更全面的长读测序是否产生了对遗传诊断有价值的信息。我们非常高兴地发现,在我们研究的对象中发现了大量额外的可能重要的遗传变异和表观遗传信号。尽管现在还为时尚早,但这些信息具有巨大的潜力,科学界将需要时间来全面理解它。”
识别罕见疾病
这项研究集中在罕见的单基因疾病上,这些疾病源于单个基因的问题。
为了诊断遗传疾病,科学家分析基因材料中的变异—可能 disrupt 它们正常功能的基因差异。识别这些变异的标准方法是短读测序,它读取约150-250个基因碱基对的序列—腺嘌呤(A)、胞嘧啶(C)、鸟嘌呤(G)和胸腺嘧啶(T)的组合。
然而,短读测序存在局限性,因为它可能忽略某些基因组区域的关键细节,特别是超过250的碱基对模式。此外,它无法进行“相位分析”,即识别来自每位父母的遗传变异的遗传。该信息对遗传评估尤其有益,尤其是在父母的遗传数据不可用时。
另一方面,长读测序可以一次读取广泛的DNA片段,因此避免了可能导致缺失关于基因变异的关键信息的间隙。此外,长读测序提供直接的相位数据和关于甲基化的见解—一种影响基因活性并与多种疾病相关的化学过程。
“长读测序在某些情况下显示出显著更高的有效性,我们正在系统地证明这一点,”内吉表示。
推动方法学的发展
UCSC基因组研究所的研究人员在长读测序方面拥有显著的创新历史。他们正在不断改进在各种健康研究应用中的最佳测序和分析方法。这些研究人员开发的许多技术,包括第一个完整的“端粒到端粒”基因组参考,如今都在改善患者护理。
“与之前的发现一致,我们发现当使用完整的‘端粒到端粒’参考基因组而不是通常使用的不完整基因组参考时,长读测序的优势显著增加,”米加指出。“我们预计,泛基因组—展现多样人类遗传变异的复制品—将从目前的长读测序技术中获得更大的益处。”
帕滕和米加的实验室与临床医生合作,评估了42名罕见疾病患者—一些通过短读测序或其他专业评估诊断,而其他人则仍未诊断。在某些情况下,有父母的遗传数据可用,而在其他情况下则不可用。
患者的长读测序由米加实验室进行,使用纳米孔测序—在UCSC建立的一种长读测序方法—以每个样本约1,000美元的费用生成高度准确的、全面的患者基因组阅读。
基因组数据通过帕滕实验室开发的计算方法进行分析,这些方法通过一个称为Napu管道的单一过程识别小和大变异、相位数据和甲基化数据。根据计算机的处理能力,分析通常需要约一天或更少,费用约为100美元。
解决诊断挑战
在对患者数据进行测序和分析后,研究人员发现,长读测序生成的数据集比短读测序可获取的结果更为全面。
长读测序为研究中的42名患者中的11名提供了确诊。这种方法捕捉了短读数据中可获取的所有见解,并提供了额外的信息,如罕见变异候选、长距离相位和甲基化—all achievable through a single, economical, and expedited protocol.
确诊案例包括四起先天性肾上腺发育不全(一种特征为发育不良的肾上腺腺体无法正常工作的罕见疾病)。导致这种情况的特定基因位于基因组的难以描述区域,短读测序未能充分表征,现行临床测试也不够充分。
“为了解决这些病例,我们开发了一种新的泛基因组工具,整合了高质量的组装,如‘端粒到端粒’参考基因组,”蒙朗说,他在帕滕的实验室作为博士后研究员发起了这个项目,并在法国INSERM继续担任他现在的角色。“我们很高兴发现,我们能够识别并分相所有四名受此病影响患者的致病变异。在将来,这可能会导致快速且全面的临床检测,揭示传统复杂基因组区域中许多罕见疾病的见解,从而激励我们将我们的方法应用于其他在研究中一直停滞不前的病症。”
此外,两个案例与性发育障碍有关,而一个罕见的莱迪希细胞发育不良案例影响到男性由于睾丸中莱迪希细胞发育不良导致的性成熟。此外,四起神经发育障碍病例,每个病例都经历了漫长而艰难的诊断旅程,最终得到解决。
“长读测序很可能是解决未解决病例的下一个最佳解决方案,这些病例具有在单个基因中有趣的变异或明确的表型,”内吉提到。“它可以作为统一的诊断测试,减少对多次临床访问的需求,将过去需要数年的时间压缩为几小时。”
平均每名患者有280个基因,包括多个与自遗传疾病相关的孟德尔病基因,显著的编码区域是短读所无法获取的。
“长读可以解锁基因组的更大部分,”内吉表示。“然而,在我们能够完全理解长读所揭示的新信息之前,还需要时间。我们临床数据库中的许多见解未曾被发现,这些数据库是基于短读数据映射到标准参考构建的。我们的研究表明,长读可以访问大约5.8%更多的端粒到端粒基因组,这在短读中根本不可获得。”
其他参与此研究的加州大学圣克鲁兹分校的研究者包括布兰迪·麦克纳尔蒂、伊沃·维奥利奇、乔舒亚·加丁、托德·希拉克和萨拉·奥鲁克。
这项研究获得了陈-扎克伯格倡议的部分资助。