百川智能发布医疗大模型幻觉率降至2.6% 免费开放API接口

问题：医疗大模型临床与教学等场景的应用需求持续增长，但“回答看似专业却缺乏依据”的幻觉问题，长期制约其在高风险医疗场景的落地。医疗决策强调可解释、可追溯与可核验，一旦生成内容出现事实偏差或引用失准，可能带来误导性建议，并引发安全风险与合规压力。如何在提升效率的同时，将不确定性控制在可管理范围内，成为行业共同面对的关键课题。原因：一上，医学知识更新快、证据层级复杂，仅依赖参数记忆难以覆盖细分疾病、特定人群及最新研究结论；另一方面，模型生成机制偏向“补全式表达”，信息不足或证据冲突时，容易出现过度自信的表述。此外，医学研究文献数量庞大且质量不一，若缺少统一的循证范式与严格的引用校验，模型推理链条易发生偏差，形成“结论先行、证据滞后”的风险。影响：据企业介绍，M3 Plus提出“证据锚定”技术，为生成内容提供引文来源，并将每一句医学结论对应到原始论文中的具体证据段落，提升结果的可核验性。在训练与推理环节，模型引入经过验证的多源循证范式，要求每条建议都有专业医学证据支撑；同时加入引用质量约束机制，对错误引用施加惩罚，促使模型在“确有证据”的范围内推理与生成。企业称，该模型将事实性幻觉率降至2.6%，并将结论与证据段落的匹配准确率提升至95%以上。若上述指标在更广泛场景中得到验证，有望缓解医疗大模型“能用但不敢用”的顾虑，推动其从信息检索、知识问答继续延伸至临床辅助与规范化教学等更高要求场景。对策：从行业治理角度看，降低幻觉风险不应仅依赖单一模型能力提升，还需“技术约束+流程管理+责任边界”合力推进。其一，在技术层面强化证据可追溯与引用校验，推动从“生成答案”转向“生成可核验的依据链”。其二，在应用层面建立贴合临床流程的使用规范，明确模型输出定位为辅助信息与参考意见，强调医务人员的最终判断权与审核责任。其三，在机构管理层面推动数据安全、隐私保护、日志留存与风险预警等制度建设，形成可审计、可复盘的闭环。其四，在评价体系上，除准确率等指标外，还应关注真实病例与复杂场景下的稳健性、引用可靠性、证据冲突处理能力以及不确定性表达的规范性。前景：此次发布同时提出“海纳百川”计划，面向服务医务工作者的机构免费开放API，覆盖临床辅助决策、医学教育等场景。免费开放有望降低机构试用与集成成本，加快从试点到规模化应用，并促进更多场景数据与反馈回流，推动模型迭代优化。同时，医疗智能化应用的边界与规范仍需在实践中进一步明确：一上，医疗场景高度依赖标准化流程与证据等级，模型的可追溯能力将成为关键能力；另一方面，随着更多机构接入，如何确保不同场景、不同人群与不同疾病领域的表现一致，如何应对罕见病、合并症等复杂问题，将成为检验技术成熟度的重要指标。未来，若能权威评测、临床研究验证与行业标准建设上形成合力，医疗大模型有望在减轻文书负担、提升信息获取效率、辅助临床决策与医学教育等释放更大价值。

医疗AI的价值最终应落到改善患者诊疗效果与提升医疗服务质量上。百川智能M3 Plus的推出，表明了国内医疗大模型能力的深入提升，更重要的是通过“证据锚定”等机制，让医学有关生成过程更透明、可核验、可控。随着更多高质量医疗AI工具落地应用，医疗行业的智能化进程有望进一步加快，并在更规范的框架下释放实际效益。

百川智能发布医疗大模型 幻觉率降至2.6% 免费开放API接口

百川智能发布医疗大模型幻觉率降至2.6% 免费开放API接口