一项最新研究表明,人工智能聊天机器人,包括ChatGPT,对于患有下背痛的人来说,几乎可以与寻求医生的建议一样有效。
这项由全球团队进行的研究强调了人工智能在解决全球主要残疾原因之一中的作用。
参与研究的副教授布鲁诺·蒂罗蒂·萨拉吉奥托(Bruno Tirotti Saragiotto)提到,该研究的目的是评估像ChatGPT这样的人工智能聊天机器人在回答与下背痛相关的常见问题时的有效性。
这项题为《评估人工智能聊天机器人在回答患者关于下背痛的常见问题的表现》的研究,最近发表于《风湿病学年鉴》(Annals of the Rheumatic Diseases)期刊上。
下背痛影响着全球数百万人,通常使受影响者在网上寻求信息。
随着越来越多的人工智能驱动的聊天机器人提供健康建议,确定其建议的准确性至关重要。
“结果表明,人工智能聊天机器人提供的指导准确性与澳大利亚医疗专业人员的水平相似,”萨拉吉奥托副教授说道。
研究发现,在回答关于治疗建议和自我护理的提问时,人工智能聊天机器人表现良好,但在有关风险因素的问题上显示出较多不准确性。
例如,当被问及“哪些辅助疗法如按摩或针灸可以缓解下背痛?”时,聊天机器人提供了准确的回答。此外,研究指出,人工智能聊天机器人始终推荐锻炼作为既能预防又能管理下背痛的有效方法,这一建议是准确的。
然而,研究还揭示,人工智能聊天机器人有时对其他常见问题提供了错误的建议。例如,尽管不良姿势并不是下背痛的直接原因,但聊天机器人错误地将其作为原因的频率高达88%。
另一个重要发现是聊天机器人能够识别需要用户寻求医疗护理的情况。在需要医疗专业人员的情况下,人工智能系统在70-100%的情况下建议用户咨询医疗提供者。
“我们的发现表明,人工智能聊天机器人可以作为寻求下背痛初步管理建议的个体的有用工具,”悉尼大学肌肉骨骼健康研究所的研究员吉奥瓦尼·费雷拉(Giovanni Ferreira)博士解释说,他是该研究的作者之一。
“然而,强调这些资源应该补充而非替代专业医疗建议至关重要,”费雷拉博士补充道。
尽管这些结果令人鼓舞,但研究人员也发现了人工智能聊天机器人表现的一些局限性。值得注意的是,回答往往较复杂,要求的阅读水平适合10到12年级或大学生。
“尽管人工智能生成的建议准确性值得称赞,但我们还必须考虑这些信息的可获取性,”萨拉吉奥托副教授评论道。
“确保健康指导对大众而言清晰易懂仍然是人工智能健康工具发展的重大挑战。”
这项研究具有时效性,因为越来越多的人依赖数字健康信息,通常在咨询医疗提供者之前寻求在线资源。
萨拉吉奥托副教授强调了认识到人工智能资源在管理下背痛等普遍健康问题方面的优势和劣势的重要性。
“随着人工智能技术的发展,持续的研究对于改进这些工具并确保它们向公众提供准确、易懂和安全的健康信息至关重要,”他总结道。