一支团队公布了一种多功能大型语言模型,以增强围手术期护理。
每年有数百万美国人接受手术。手术后,预防肺炎、血栓和感染等并发症可能是成功恢复和延长、痛苦住院之间的区别——或者更糟。超过10%的外科患者经历此类并发症,这可能导致在重症监护室(ICU)的住院时间更长、死亡率更高和医疗费用增加。及早识别高风险患者至关重要,但准确预测这些风险仍然是一个挑战。
人工智能(AI)的新进展,特别是大型语言模型(LLMs),现在提供了一个有前景的解决方案。华盛顿大学圣路易斯分校麦克凯尔维工程学院计算机科学与工程的全教授何阳·鲁(Chenyang Lu)领导的一项最新研究探讨了通过分析围手术期评估和临床记录,LLMs预测术后并发症的潜力。这项工作于2月11日在线发表在《npj Digital Medicine》上,显示专业LLMs在预测术后风险方面可以显著优于传统机器学习方法。
鲁表示:“手术带来了显著的风险和成本,但临床记录中蕴含着外科团队的丰富宝贵见解。我们针对外科记录量身定制的大型语言模型,实现了对术后并发症的早期准确预测。通过主动识别风险,临床医生可以更早介入,从而提高患者的安全性和治疗效果。”
传统的风险预测模型主要依赖于结构化数据,如实验室检查结果、患者人口统计信息和手术细节(如手术持续时间或外科医生的经验)。尽管这些信息无疑是有价值的,但它常常缺乏患者独特临床叙述的细腻之处,而这些细腻之处被详细的临床记录所捕捉。这些记录包含了患者病史、当前状况和其他影响并发症可能性的因素的个性化叙述。
鲁和共同第一作者查尔斯·阿尔巴(Charles Alba)与雪冰(Bing Xue),在研究进行时也都是鲁的研究生,利用专门训练的大型语言模型,基于公开的医学文献和电子健康记录进行训练。然后,他们对预训练模型进行了微调,以更好地预测手术结果。最终的方法——首个处理外科记录并利用其预测术后结果的方法——可以超越结构化数据,识别患者状况中可能被忽视的模式。
基于2018年至2021年期间从一家中西部学术医疗中心收集的近85,000份手术记录及相关患者结果,团队报告称,他们的模型在预测并发症方面的表现远远优于传统方法。对于每100名经历术后并发症的患者,该团队的新模型正确预测了39名更多有并发症的患者,相比于传统自然语言处理模型。
除了可能早期发现并减轻外科并发症患者的数量,该研究还展示了基础AI模型的强大,基础AI模型旨在多任务处理,适用于广泛的问题。
阿尔巴说:“基础模型可以多样化,因此通常比专业模型更有用。在这种大量可能发生并发症的情况下,模型需要足够灵活,能够预测多种不同的结果。我发现我们同时为多个任务微调的模型,比专门训练以检测个别并发症的模型更准确地预测了并发症。这是合理的,因为并发症通常是相关的,因此统一的基础模型受益于不同结果的共享知识,而不必为每个结果进行繁琐的微调。”
华盛顿大学医学部麻醉学副教授兼华盛顿大学医学信息学研究所(I2)成员乔安娜·阿布拉哈姆(Joanna Abraham)表示:“这个多功能模型有潜力在各种临床环境中部署,以预测各种并发症。通过及早识别风险,它可能成为临床医生的无价工具,使他们能够采取主动措施,量身定制干预以改善患者结果。”
本研究由美国卫生与公共服务部卫生研究与质量局资助(R01 HS029324-02)。