钉钉的ai 技术这次可真是搞了个大新闻。他们家的dingtalk-deepresearch

钉钉的AI技术这次可真是搞了个大新闻。他们家的Dingtalk-DeepResearch在DeepResearch Bench这个国际权威评测里拿到了48.49分的好成绩,直接把国内其他系统甩在了后面,甚至比OpenAI和Claude这些国外大佬还强。这个系统不但在理论上赢了,实际应用也很牛。钉钉的团队把它放进了制造业和供应链这些复杂场景里去干活,结果发现它在处理复杂的表格数据、搞多阶段推理和生成多模态内容的时候特别稳,帮企业把那些乱七八糟的数据整理得明明白白。 这种能同时拿下国际顶尖Benchmark又能真正落地的本事,可是个大突破,标志着中国的企业级AI技术已经冲进了第一梯队。钉钉是怎么做到的呢?他们设计了一种专门给企业用的多智能体框架,就像把不同专业的人组了个团队。有人擅长分析表格,有人负责写报告,有人负责调用工具。通过三层架构(智能体层、引擎层和数据层),系统能把很多复杂的任务同时处理。比如那些工厂里充满了嵌套和合并单元格的生产表格,系统能自动解析成清晰的报告。 为了让系统越用越聪明,他们还搞了个在线学习机制。这个机制就像员工通过反复工作提升技能一样,系统能自动从历史记录里总结经验。比如用户经常修改报告格式,系统就会记住用户喜欢的风格和重点,下次直接按这个来。这些学到的经验还能沉淀到整个公司里,让大家都能用上。 为了保证生成的内容质量不出岔子,钉钉还内置了一个叫DingAutoEvaluator的评估系统。它会对每份报告进行数据准确性、逻辑连贯性这些方面的检查。要是发现了问题,系统会自动把这个案例反馈回去重新训练模型,形成一个从生成到评估再到优化的闭环。 现在这个系统已经在供应链和制造业里稳定运行了。在供应链领域,它能帮采购人员快速分析跨部门的复杂数据;在制造业里,它能把设备运行的原始数据变成可视化报告给人看。朱鸿这位CTO也说了,这个框架结合了自适应优化和多模态推理的能力,能灵活地处理各种复杂且不断变化的业务任务。目前他们正忙着把这个技术用到搜索、表格、自动化工作流和Agent平台这些产品里去,让前沿的AI技术真正落地到生产中去。