一个跨学科研究团队揭示了世界上第一个人工智能(AI)模型,该模型旨在对甲状腺癌的癌症阶段和风险类别进行分类,实现了超过90%的惊人准确率。这个创新的AI模型承诺将前线临床医生的预咨询准备时间缩短约50%,与香港特别行政区政府利用AI技术改善医疗服务的倡议相一致。
来自香港大学李嘉诚医学院(HKUMed)、InnoHK健康数据发现实验室(InnoHK D24H)和伦敦卫生与热带医学院(LSHTM)的跨学科研究团队揭示了世界上第一个人工智能(AI)模型,该模型旨在对甲状腺癌的癌症阶段和风险类别进行分类,实现了超过90%的惊人准确率。这个创新的HKUMed AI模型承诺将前线临床医生的预咨询准备时间缩短约50%,与香港特别行政区政府利用AI技术改善医疗服务的倡议相一致。研究结果发表在《npj数字医学》期刊上。
甲状腺癌是香港和全球最常见的癌症之一。对这种疾病的精确管理通常依赖于两个系统:(1)第八版美国癌症联合委员会(AJCC)或肿瘤-淋巴结-转移(TNM)癌症分期系统来确定癌症阶段;(2)美国甲状腺协会(ATA)风险分类系统来对癌症风险进行分类。这些系统对于预测患者生存和指导治疗决策至关重要。然而,手动将复杂的临床信息整合到这些系统中可能耗时且效率低下。
研究团队开发了一款名为AI助手的工具,利用大语言模型(LLMs),如ChatGPT和DeepSeek,旨在理解和处理人类语言,以分析临床文档并增强甲状腺癌分期和风险分类的准确性和效率。
该模型利用四个离线开放源代码的LLM——Mistral(Mistral AI)、Llama(Meta)、Gemma(Google)和Qwen(阿里巴巴)——来分析自由文本临床文档。AI模型是通过基于美国的开放访问数据训练的,其中包括来自癌症基因组图谱计划(TCGA)的50名甲状腺癌患者的病理报告,随后与289名TCGA患者的病理报告和35个由内分泌外科医生创建的伪病例进行验证。
通过结合所有四个LLM的输出,团队提高了AI模型的整体性能,在ATA风险分类中实现了88.5%至100%的整体准确率,在AJCC癌症分期中实现了92.9%至98.1%的准确率。与传统的手动文档审核相比,这一进展预计将使临床医生在预咨询准备上花费的时间减半。
吴卓琪教授,公共卫生的港岛教授及HKUMed的InnoHK D24H董事总经理,强调了该模型的卓越表现。“我们的模型在分类AJCC癌症阶段和ATA风险类别方面的准确率超过90%,”他说。“该模型的一大优势是它的离线能力,这将允许在无需分享或上传敏感患者信息的情况下进行本地部署,从而提供最大限度的隐私保护。”
他说:“鉴于DeepSeek最近的首次亮相,我们还利用‘零样本方法’与DeepSeek的最新版本—R1和V3—以及GPT-4o进行了进一步比较测试。我们高兴地发现,我们的模型的表现与这些强大的在线LLM相当。”
方敏贤医生,HKUMed临床医学学院外科系内分泌外科的临床助理教授和主任表示:“除了在从复杂的病理报告、手术记录和临床笔记中提取和分析信息方面提供高准确性外,我们的AI模型还显著减少了医生的准备时间,比人工解读减少了近一半。它可以基于两个国际公认的临床系统同时提供癌症分期和临床风险分层。”
方医生表示:“该AI模型具有多功能性,可以容易地集成到公共和私营部门的各种环境中,以及本地和国际医疗及研究机构。”他说:“我们乐观地认为,该AI模型在现实世界的实施可以提高前线临床医生的效率,并改善护理质量。此外,医生将有更多时间与患者咨询。”
HKUMed家庭医学与初级护理系的荣誉副教授、临床医学学院的Carlos Wong医生解释道:“根据政府在医疗领域大力倡导AI应用的方向,例如最近在医院管理局推出的基于LLM的医学报告编写系统,我们的下一步是使用大量的真实患者数据评估该AI助手的性能。一旦验证,该AI模型可以在真实临床环境和医院中立即部署,以帮助临床医生提高操作和治疗效率。”
该研究由吴卓琪教授、公共卫生学院的罗伯特·科特华教授、InnoHK D24H的董事总经理兼首席科学家;方敏贤医生,HKUMed临床医学学院外科系的临床助理教授和内分泌外科主任;以及HKUMed临床医学学院家庭医学与初级护理系的荣誉副教授,InnoHK D24H的高级研究主任Carlos Wong医生领导。第一作者为InnoHK D24H的Eric Tang Ho-man医生和Wu Tingting医生。