百川智能发布医疗大模型 幻觉率降至2.6% 免费开放API接口

问题:医疗大模型临床与教学等场景的应用需求持续增长,但“回答看似专业却缺乏依据”的幻觉问题,长期制约其在高风险医疗场景的落地。医疗决策强调可解释、可追溯与可核验,一旦生成内容出现事实偏差或引用失准,可能带来误导性建议,并引发安全风险与合规压力。如何在提升效率的同时,将不确定性控制在可管理范围内,成为行业共同面对的关键课题。 原因:一上,医学知识更新快、证据层级复杂,仅依赖参数记忆难以覆盖细分疾病、特定人群及最新研究结论;另一方面,模型生成机制偏向“补全式表达”,信息不足或证据冲突时,容易出现过度自信的表述。此外,医学研究文献数量庞大且质量不一,若缺少统一的循证范式与严格的引用校验,模型推理链条易发生偏差,形成“结论先行、证据滞后”的风险。 影响:据企业介绍,M3 Plus提出“证据锚定”技术,为生成内容提供引文来源,并将每一句医学结论对应到原始论文中的具体证据段落,提升结果的可核验性。在训练与推理环节,模型引入经过验证的多源循证范式,要求每条建议都有专业医学证据支撑;同时加入引用质量约束机制,对错误引用施加惩罚,促使模型在“确有证据”的范围内推理与生成。企业称,该模型将事实性幻觉率降至2.6%,并将结论与证据段落的匹配准确率提升至95%以上。若上述指标在更广泛场景中得到验证,有望缓解医疗大模型“能用但不敢用”的顾虑,推动其从信息检索、知识问答继续延伸至临床辅助与规范化教学等更高要求场景。 对策:从行业治理角度看,降低幻觉风险不应仅依赖单一模型能力提升,还需“技术约束+流程管理+责任边界”合力推进。其一,在技术层面强化证据可追溯与引用校验,推动从“生成答案”转向“生成可核验的依据链”。其二,在应用层面建立贴合临床流程的使用规范,明确模型输出定位为辅助信息与参考意见,强调医务人员的最终判断权与审核责任。其三,在机构管理层面推动数据安全、隐私保护、日志留存与风险预警等制度建设,形成可审计、可复盘的闭环。其四,在评价体系上,除准确率等指标外,还应关注真实病例与复杂场景下的稳健性、引用可靠性、证据冲突处理能力以及不确定性表达的规范性。 前景:此次发布同时提出“海纳百川”计划,面向服务医务工作者的机构免费开放API,覆盖临床辅助决策、医学教育等场景。免费开放有望降低机构试用与集成成本,加快从试点到规模化应用,并促进更多场景数据与反馈回流,推动模型迭代优化。同时,医疗智能化应用的边界与规范仍需在实践中进一步明确:一上,医疗场景高度依赖标准化流程与证据等级,模型的可追溯能力将成为关键能力;另一方面,随着更多机构接入,如何确保不同场景、不同人群与不同疾病领域的表现一致,如何应对罕见病、合并症等复杂问题,将成为检验技术成熟度的重要指标。未来,若能权威评测、临床研究验证与行业标准建设上形成合力,医疗大模型有望在减轻文书负担、提升信息获取效率、辅助临床决策与医学教育等释放更大价值。

医疗AI的价值最终应落到改善患者诊疗效果与提升医疗服务质量上。百川智能M3 Plus的推出,表明了国内医疗大模型能力的深入提升,更重要的是通过“证据锚定”等机制,让医学有关生成过程更透明、可核验、可控。随着更多高质量医疗AI工具落地应用,医疗行业的智能化进程有望进一步加快,并在更规范的框架下释放实际效益。