钉钉的ai 技术这次可真是搞了个大新闻。他们家的dingtalk-deepresearch

钉钉的AI技术这次可真是搞了个大新闻。他们家的Dingtalk-DeepResearch在DeepResearch Bench这个国际权威评测里拿到了48.49分的好成绩，直接把国内其他系统甩在了后面，甚至比OpenAI和Claude这些国外大佬还强。这个系统不但在理论上赢了，实际应用也很牛。钉钉的团队把它放进了制造业和供应链这些复杂场景里去干活，结果发现它在处理复杂的表格数据、搞多阶段推理和生成多模态内容的时候特别稳，帮企业把那些乱七八糟的数据整理得明明白白。这种能同时拿下国际顶尖Benchmark又能真正落地的本事，可是个大突破，标志着中国的企业级AI技术已经冲进了第一梯队。钉钉是怎么做到的呢？他们设计了一种专门给企业用的多智能体框架，就像把不同专业的人组了个团队。有人擅长分析表格，有人负责写报告，有人负责调用工具。通过三层架构（智能体层、引擎层和数据层），系统能把很多复杂的任务同时处理。比如那些工厂里充满了嵌套和合并单元格的生产表格，系统能自动解析成清晰的报告。为了让系统越用越聪明，他们还搞了个在线学习机制。这个机制就像员工通过反复工作提升技能一样，系统能自动从历史记录里总结经验。比如用户经常修改报告格式，系统就会记住用户喜欢的风格和重点，下次直接按这个来。这些学到的经验还能沉淀到整个公司里，让大家都能用上。为了保证生成的内容质量不出岔子，钉钉还内置了一个叫DingAutoEvaluator的评估系统。它会对每份报告进行数据准确性、逻辑连贯性这些方面的检查。要是发现了问题，系统会自动把这个案例反馈回去重新训练模型，形成一个从生成到评估再到优化的闭环。现在这个系统已经在供应链和制造业里稳定运行了。在供应链领域，它能帮采购人员快速分析跨部门的复杂数据；在制造业里，它能把设备运行的原始数据变成可视化报告给人看。朱鸿这位CTO也说了，这个框架结合了自适应优化和多模态推理的能力，能灵活地处理各种复杂且不断变化的业务任务。目前他们正忙着把这个技术用到搜索、表格、自动化工作流和Agent平台这些产品里去，让前沿的AI技术真正落地到生产中去。