研究人员创建了一个针对拉丁美洲人的综合详细基因组数据库。该数据库将来自不同拉丁美洲人群的基因组广泛信息整合成一个可访问的资源,使其他科学家能够在没有显著财务负担的情况下将这些数据整合到他们的研究中。
普遍认为,现有的基因组数据库主要偏向于欧洲裔个体。专家们警告说,忽视其他人口统计数据可能会导致在药物创造、诊断评估和多基因风险评分等关键领域产生误导性结果,后者评估一个人DNA中的多种遗传变异以预测潜在的健康风险。
在马里兰大学医学院基因组科学研究所(IGS),研究人员组建了一个针对拉丁美洲人的大型基因组数据库。这个新资源将来自拉丁美洲群体的基因组广泛数据汇总到一个单一平台上,便于以可管理的成本将该人群纳入其他研究工作中。他们的研究成果发表于10月31日的Cell Genomics期刊。
该团队将拉丁美洲人定义为拥有来自美洲西班牙语或葡萄牙语国家的祖先的个体。在美国,拉丁美洲人占人口的18%,是增长最快的人口群体,但在生物医学研究中仍然代表性不足,这导致了健康不平等。全球有大约6.56亿拉丁美洲人,占世界总人口的约8.5%。
拉丁美洲多样性基因组数据库(GLADdb)包括来自46个不同地理区域近54,000名拉丁美洲人的基因组广泛数据。这个新建立的资源研究拉丁美洲人的人口结构,并提供一种名为GLAD-match的工具,帮助研究人员将外部样本中的基因与数据库中的基因对齐。GLAD-match为遗传研究社区提供了宝贵的资产,促进了从一般化分类向认可祖先作为连续谱的转变。
“将拉丁美洲人视为一个单一、统一的群体会忽视他们丰富的遗传多样性,这可能会阻碍在人群健康和多种疾病治疗方面的进展,”研究的主要作者、IGS科学家以及UMSOM医学副教授的Timothy O’Connor博士表示。“我们的目标是促进拉丁美洲人的基因组研究,从而增强精准医学惠及更广泛人群的潜力。”
为了构建GLADdb和GLAD-match,研究人员收集了来自动美洲的全基因组测序项目的数据,以及由国家人类基因组研究所(NHGRI)建立的基因型与表型数据库dbGaP,该数据库存储和共享人类的遗传研究数据。大多数NHGRI资助的基因组研究在发表后都需要将其发现提交至dbGaP。
“我们对‘遗产’的理解包括文化、地理和遗传,这使我们能够通过迁徙和人口结构研究拉丁美洲国家之间的历史遗传关系,”研究的通讯作者、IGS研究助理的Victor Borda博士表示。“例如,在20世纪初,由于各种社会和经济问题,波多黎各遭遇了大量外迁。我们的研究表明,移居夏威夷的大多数是从事农业的农村个体,而迁往纽约的移民则来自各种社会和经济背景。”
目前,拉丁美洲人仅占全基因组关联研究(GWAS)参与者的约0.38%。研究人员认为,GLADdb可以通过将外部样本与数据库中的样本进行比较,从而显著增强对拉丁美洲人群体遗传学和遗传流行病学的理解。
O’Connor博士指出,“我们对影响拉丁美洲人健康的遗传多样性和环境因素的有限了解限制了医学领域对该人群复杂特征的把握。我们希望其他研究人员在调查中利用GLADdb和GLAD-match,增强我们的见解,并在精准医学的发展中解决拉丁美洲人群内的差异。”