最近智象未来(HiDream.ai)跟诺亦腾机器人(Noitom Robotics)正式合作,要把具身智能数据的玩法给改改了。现在做具身智能很缺高质量的训练数据,不像语言模型能随便找很多文本。诺亦腾那边是做人体动作捕捉和多模态数据采集的,而智象未来擅长多模态大模型,特别是毫米级可控的视频生成。大家打算把真实动捕数据跟生成的视频混在一起,今年内搞出几万小时的训练数据,这就能解决行业里数据少且贵的难题。 仪式上,诺亦腾机器人创始人戴若犁、智象未来创始人梅涛,还有他们的CTO姚霆、韩磊博士都来了。诺亦腾是做具身智能与人形机器人数据的公司,给企业和模型团队提供高质量训练数据和基础设施。他们认为现在的产业瓶颈在数据,所以要从底层做起。韩磊博士说具身智能是个数据驱动的系统工程,单一数据不行,得结合真实动作和生成视频。 智象未来是搞多模态生成式AI的,这次用高可控技术把动作捕捉的原始数据放大了一百倍以上。这种技术不是简单堆积素材,而是把精准的指令和复杂场景融合。姚霆博士说普通视频模型容易出幻觉,为了让物理世界的一致性达标,他们把传感动捕数据做了生成式优化。 以后双方还会在高质量底层数据构建、VLA模型演进以及视频建模与动作预测协同方面合作。智象未来用多模态大模型的优势去扩展高精度Human-centric数据的视觉精细度;诺亦腾提供真实反馈数据。他们要一起弄一个从虚拟生成到物理验证的完整闭环,加速具身智能时代到来。