德国癌症研究中心(DKFZ)和欧洲生物信息学研究所(EMBL-EBI,英国欣克斯顿)的研究人员正在利用丹麦健康注册的数据,预测20种不同类型癌症的个体风险,精确度显著。该预测模型有潜力应用于其他医疗保健系统,并能够精准识别出癌症高风险个体。这可能导致个性化早期筛查项目的开发,并可在临床试验中进行测试。癌症信息中心目前已开发出一种方法,以预测患者何时发展为癌症。这可以帮助识别高风险患者,为他们量身定制个性化早期筛查程序,以便在研究中进行测试。
当癌症早期发现时,恢复的几率通常较高,患者需要的治疗也较少。然而,目前仅为少数类型肿瘤提供早期筛查程序,并非每个人都能利用这些机会。
如果有一种简单的方法可以识别出极高风险发展为癌症的人群,筛查程序可以专门针对这些风险者进行定制。由DKFZ和欧洲癌症信息中心的莫里茨·格斯滕(Moritz Gerstung)领导的研究人员,现已开发出一种方法,以预测患者发展为癌症的年龄。这可以帮助识别高风险癌症患者,为他们的个性化早期筛查项目提供研究依据。
位于英国欣克斯顿的生物信息学研究所EMBL-EBI发布了一项关于使用丹麦健康注册的综合数据评估20种不同类型癌症个体疾病风险的可行性研究。数据科学家使用1995年至2014年间670万成年丹麦人的临床诊断数据训练预测模型。训练数据集中包括1000多个以往的诊断、家族癌症病史、年龄、基本身体数据以及吸烟和肥胖等风险因素。
该模型使用2015年至2018年的数据集进行了验证,验证数据集包含470万丹麦人,显示出在预测发展为20种不同类型癌症的个体风险方面具有很高的准确性。该模型一生的准确率达81%,考虑年龄和性别影响后,准确率为59%。该模型在预测消化系统癌症、甲状腺癌、肾癌和子宫癌方面最为准确。
为了验证其在其他国家健康数据中的预测性能,该模型也进行了准确性测试。研究人员还使用来自英国生物样本库的数据对模型进行了验证,并取得了类似的准确性。尽管这些分析无法确切预测谁会发展为癌症,但可以计算个体风险,并将其与同龄人进行比较。
“通过这项研究,我们旨在表明,确实可以使用国家健康数据对个体癌症风险进行建模,”莫里茨·格斯滕解释道。这种风险分层可能为那些最能受益的人提供额外的早期检测测试。除了目前的早期检测方法之外,这些测试还可能未来纳入针对血液的癌症测试,目前正在全球范围内进行激烈研究,可能会彻底改变癌症检测。在某些情况下,临床试验已经在进行中,希望这些测试能够根据个体风险因素识别更广泛的癌症。这可能减少低风险个体不必要的检测,防止假阳性结果和过度诊断。
然而,正如莫里茨·格斯滕强调的那样,全面和可靠的数据库对于这些测试的成功至关重要。丹麦健康数据库的广泛性和互联性使其成为这类研究的宝贵资源。只有少数欧洲国家具备类似能力。
在芬兰和瑞典等其他国家也有类似的努力,以及英国的专门研究小组。
德国也在努力建立数字健康基础设施。“在规划阶段考虑什么类型的数据最适合评估癌症风险将是明智的,”格斯滕表示。在他目前的研究中,他发现ICD-10诊断代码在其他欧洲医疗系统中使用,有帮助。
有关身体测量的基本信息和吸烟等已知风险因素也提供了有价值的数据,因此,简化此类信息的收集对于人口水平的数据将是有益的。“如果这些数据在丹麦健康注册中普遍可用,我们的预测模型可能会更加精确,”格斯滕总结道。