一项研究发现,当患者信息不完整时,人工智能聊天机器人的诊断准确率会大幅下降。尽管越来越多人开始依赖AI进行轻度症状的初步咨询,但专家警告,这可能导致误判并危害健康。哈佛医学院研究团队评估了包括GPT、Gemini和Claude在内的21款前沿大语言模型的诊断能力。结果显示,在患者数据不足的情况下,针对“鉴别诊断”(即根据症状和体征推断可能病症)的失败率高达80%。当补充检测结果后,“最终诊断”的失败率降至40%。虽然AI在患者信息充足时表现优异,但在信息不确定时的判断能力仍显薄弱,而这正是现实医疗实践中常见的起点。分析指出,用户完全依赖AI进行自我诊断为时过早。研究团队提醒:“AI擅长在数据完整时精准锁定最终诊断,但在信息有限的早期阶段仍面临挑战。目前尚未达到无需医疗专业人员参与即可独立指导患者决策的水平。”
AI诊断翻车率高达80%,早期病情识别成硬伤
未经允许不得转载:洛伊网 » AI诊断翻车率高达80%,早期病情识别成硬伤






