一组研究人员创建了一个分析管道,旨在利用五个包含基因-疾病连接的数据库,寻找与特定疾病相关的此前未被识别的基因。他们使用这个管道调查了氧化应激及其与帕金森病的关系,作为一个实际的例子。
来自广岛大学的研究团队开发了一个分析管道,以揭示与特定疾病相关的此前被忽视的基因,使用五个包含基因-疾病关系的数据库。他们的管道被用于在一个案例研究中调查氧化应激及其与帕金森病的关系。
他们研究的发现于2024年8月17日发表在期刊npj Parkinson’s Disease上。
科学家可以从多个数据库获取与人类疾病相关的基因数据,包括开放目标平台、DisGeNET、miRTex、RNADisease和PubChem。然而,由于策展错误、偏见和文本挖掘失败,这些数据库有时缺少某些条目。此外,由于人类疾病的研究量巨大,维护全面数据也面临挑战。研究人员承认,重要数据的缺失妨碍了知识共享,需要解决。因此,研究团队开发了一个分析管道,旨在发现与人类疾病相关的基因数据库中这些缺失条目。
“我们开发了一种方法,通过使用公共数据库来识别与疾病相关的氧化应激的新候选基因,”广岛大学基因组信息学实验室和Bio-DX实验室的教授保良秀雅表示。他们的方法主要包括三个步骤。首先,他们通过分析基因表达数据以及转录组宽关联研究结果,确定了与帕金森病和氧化应激相关的基因。其次,他们访问多个公共数据库,记录基因与疾病之间的关联,重点关注那些之前与帕金森病未关联的基因。最后,他们重新审视基因表达和转录组宽关联研究数据,以强调那些被认为更重要的基因。
“在这项研究中,以氧化应激及其与帕金森病的关系作为案例研究,我们旨在找到识别那些尚未被充分研究但具有潜在研究价值的基因的方法,”保良表示。他们的分析揭示了两个被忽视的基因:核蛋白1(NUPR1)和带有PHD和环指域的泛素样蛋白2(UHRF2)。这个管道将帮助研究人员发现与疾病相关的被低估基因,从而便于获得潜在相关功能基因的研究。
在寻找与帕金森病相关的氧化应激基因时,团队从62,226个基因筛选出168个基因,这些基因在帕金森病和氧化应激情况下显示出基因表达的变化。然后,他们根据现有证据将这168个基因分为与帕金森病相关和无关联的两类。
从与帕金森病无关的基因中,他们进一步提炼出12个未利用的候选基因。经过仔细检查,他们发现NUPR1和UHRF2是未开发的,意味着它们未被纳入当前的基因-疾病关联数据库。
研究人员指出,基因数据库中缺失条目有几种原因。一种可能是这些数据库最近没有更新。另一个原因可能是文本挖掘提取的失败。最后,一些数据库依赖于专家手动输入新信息,这可能引入人为错误或偏见。尽管如此,新创建的识别被忽视基因的分析管道有助于解决这些数据库的局限性。
在这项研究中识别出的12个基因同时响应帕金森病和氧化应激,但在与帕金森病相关的研究中尚未得到彻底调查。理解这些基因可能增强对氧化应激和帕金森病机制的理解,并在开发新治疗策略方面起到关键作用。“此外,我们引入的方法也可以用于缩小与其他疾病中氧化应激相关的候选基因的范围。这可能有助于推进氧化应激和各种疾病研究的进展,”保良指出。
该研究小组包括来自广岛大学的铃木隆之和保良秀雅以及信息与系统研究机构(RIOS)成员。
该研究得到了生物数字转型创新中心、产业与学术合作的开放创新平台(COI-NEXT)、日本科学技术机构和ROIS-DS-JOINT的支持。