研究人员利用先进的机器学习技术来提高一种国家心血管风险评估工具的准确性,同时保持其清晰性和原始风险关联性。风险评估工具在确定数百万个体的疾病风险中扮演着重要角色,因此其准确性至关重要。然而,当这些国家模型针对特定地方人群进行调整时,其有效性往往会下降,导致准确性和清晰性的损失。来自布莱根妇女医院的一个团队,该医院是马萨诸塞州综合医疗系统的一部分,使用复杂的机器学习方法来提高国家心血管风险计算器的准确性,同时确保其可解释性并保留原始风险关系。他们的研究结果显示,在来自马萨诸塞州综合医院的电子健康记录小组中,整体准确性得到了提高,大约十分之一的患者被重新归类为不同的风险类别,以便更好地制定个性化治疗决策。这些发现详细描述在《JAMA Cardiology》上。
“风险计算器极其重要,因为它们构成了医疗提供者与患者之间有关风险预防讨论的关键组成部分,”主要作者阿尼凯特·津祖瓦迪亚(Aniket Zinzuwadia)博士,布莱根妇女医院内科住院医师表示。“然而,当将这些全球计算器应用于地方社区时,可能会出现由于地区的独特特征而导致的变化,例如不同的人口因素、医生实践或风险因素——因此我们旨在定制基础心血管疾病风险模型,以便在增强当前方法的同时适应当地人群。”
美国心脏协会在2023年推出了预测心血管疾病事件风险(PREVENT)计算器,针对30至79岁的成年人。该更新工具帮助预测个体在10年和30年内发生心脏病发作、中风或心力衰竭的几率。尽管PREVENT公式在国家层面表现良好,研究人员仍希望确定他们的方法是否能够更好地与当地人群对齐风险评估。
在分析中,研究人员利用了来自95,326名2007年年龄在55岁及以上的马萨诸塞州综合医院患者的电子健康记录数据,这些患者在1997年至2006年间至少记录过一次血脂或血压测量,并在2007年至2016年间至少与医院系统互动过一次。团队使用XGBoost,一个公共的机器学习框架,调整了PREVENT的公式,同时保留了原始模型中已建立的已知风险因素与结果之间的关系。结果显示准确性有所提高,并重新识别出该小组中十分之一的患者。
“这可能指示出一组患者,他们在原始模型应用下,可能没有被处方他汀类药物,但实际上可能会从这种治疗中受益,”津祖瓦迪亚指出。
虽然在将这一技术有效整合到患者护理中之前,仍需进一步的步骤,但团队希望看看其在其他医疗系统的当地人群中的表现,最终使临床医生和研究人员能够定制全球风险模型。
“在医学研究中应用人工智能的一大挑战是确保机器学习模型不仅展现灵活性,还能透明、可信并建立在领域知识的基础上,”共同高级作者奥尔加·德姆勒(Olga Demler)博士,布莱根妇女医院预防医学部的助理生物统计学家解释道。“我们的 methodology 说明我们可以绕过人工智能应用的‘黑箱’方面,可能为维持其适应性的同时提供性能保证的高级算法铺平道路。”
著作权:参与此研究的其他作者包括奥尔加·米涅娃(Olga Mineeva)、李春颖(Chunying Li)、扎琳·法鲁基(Zareen Farukhi)、弗朗哥·朱利亚尼(Franco Giulianini)、布莱恩·凯德(Brian Cade)、林辰(Lin Chen)、伊丽莎白·卡尔森(Elizabeth Karlson)、尼娜·佩因特(Nina Paynter)和萨米亚·莫拉(Samia Mora)。
披露:萨米亚·莫拉在与当前研究无关的事务中曾担任Pfizer的顾问。奥尔加·德姆勒和尼娜·佩因特获得了来自小川研究所的与这项工作无关的资助。阿尼凯特·津祖瓦迪亚曾作为心跳健康的员工参与与这项研究无关的项目。
资助:研究工作得到了国家心脏、肺和血液研究所(K24 HL136852、R21 HL156174、R21HL167173、K01HL135342 和 R21125962)、美国心脏协会(17IGMV33860009)、瑞士联邦理工学院(ETH,瑞士苏黎世)以及来自瑞士数据科学中心/个性化健康与相关技术的Dataspectrum4CVD的支持,还得到了国家人类基因组研究所(U01HG008685)的支持。