找回密码
 注册
搜索
热搜: 活动 交友
查看: 87|回复: 0

自然医学杂志:用AI帮助看诊表现平平

[复制链接]

2万

主题

1万

回帖

25万

积分

管理员

热心会员

积分
256487
发表于 昨天 22:13 | 显示全部楼层 |阅读模式
來源:大紀元


1.webp
发表2026年2月《自然医学》(Nature Medicine)期刊上的一项新研究表明,人工智能(AI)在看诊上表现平平,用AI帮助患者做健康决策,并不比其它方法更有效。(STR/AFP/Getty Images)


【大纪元2026年02月10日讯】(大纪元记者林燕编译报导)发表在《自然医学》(Nature Medicine)杂志上的一项新研究表明,人工智能(AI)在看诊上表现平平,用AI帮助患者做健康决策,并不比其它方法(例如上网搜寻)更有效。
研究人员表示,这项研究意义重大,因为人们越来越多地转向AI和聊天机器人寻求医疗建议,但目前缺少证据表明AI是一种更佳和更安全的方法。
这项研究由牛津大学互联网研究所与一组医生合作完成,他们设计了10种不同的医疗情景,涵盖从普通感冒到危及生命的脑出血等各种情况。
研究人员首先选定了三个大型语言模型——OpenAI的Chat GPT-4o、Meta的Llama 3,和Cohere的Command R+进行测试,结果显示这些AI工具识别出了94.9%的病情,此外还在56.3%的案例中选择了正确的行动方案,例如呼叫救护车或建议患者看医。
但在实地测试环节,AI的表现则远远不如理论。研究人员在英国招募了1298名参与者,让他们分别使用AI、常用资源(例如互联网搜索、自身经验或英国国家医疗服务体系网站)来调查症状并决定下一步行动。
结果显示,参与者使用AI识别相关疾病的比例不足34.5%,而给出正确行动方案的比例也不足44.2%。这一表现与使用传统工具的对照组相比并无优势。
该论文的合著者、牛津大学副教授亚当‧马赫迪(Adam Mahdi)表示,这项研究表明AI的理论与人类实际使用之间存在着的“巨大差距”。
“这些机器人可能拥有丰富的知识;然而,这些知识在与人类互动时并不总是能够有效转化。”他说,这意味着还需要开展更多研究来探究造成这种情况的原因。
研究团队详细分析了约30次交互,并得出结论:虽然人类常常提供不完整或错误的信息,但AI也会产生误导性或不正确的回复。
例如,一位患者描述了蛛网膜下腔出血(一种危及生命的脑出血)的症状,包括颈部僵硬、畏光和“有史以来最严重的头痛”,AI正确地建议他去医院就诊。
而另一位患者描述了相同的症状,但在提到头痛时使用的是“剧烈”一词,AI只是建议他躺在调淡光线的房间里休息。
研究团队计划在不同国家、使用不同语言,并随着时间的推移开展类似研究,以测试这是否会影响AI的性能。
该研究得到了数据公司Prolific、德国非营利组织迪特‧施瓦茨基金会(Dieter Schwarz Stiftung)以及英国和美国政府的支持。

(本文依据了路透社的报导)







您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|阿波罗网

GMT+8, 2026-2-19 03:35

快速回复 返回顶部 返回列表