问题——大模型能力快速迭代的同时,算力、能源与高质量数据的约束日益凸显;随着应用场景从对话、检索向编程、科研、复杂决策扩展,模型既要“更强”,也要“更省、更稳、更可用”。如何资源边界内持续提升智能水平、形成可验证的技术路径,并让技术红利更广泛惠及产业与社会,成为行业面临的共同课题。 原因——技术路线正在从“堆规模”转向“提效率”。杨植麟在论坛发言中将大模型本质概括为“将能源转化为智能”,并指出规模化仍是能力跃迁的重要基础,但关键不在简单叠加算力,而在系统性提升训练与推理效率。他认为,有效数据在一定阶段呈现有限性,若仍依赖传统方式扩大数据与算力投入,将面临边际收益递减与成本上升的双重压力。另外,行业研发方式也在变化:随着算力条件改善与工程体系成熟,研究正在从过去较偏学术、以单点创意为起点的路径,转向强调与工程深度结合、依托规模化实验验证结论的路径,这也使不少“既有标准”具备被重新检验与改写的条件。 影响——效率导向的规模化策略正在重塑模型能力边界与产业协作方式。针对“在有限资源下实现智能最大化”目标,杨植麟披露其团队正在从三条主线推进:一是Token效率,通过更优网络结构与优化方法在相同数据量中学习到更多有效能力;二是长上下文能力,以自研架构拓展模型处理更长输入的稳定性与输出能力,支撑更复杂任务;三是智能体集群,通过多智能体协同突破单体执行效率瓶颈,使系统在多步骤任务分解、工具调用与并行探索上具备更强综合能力。其间,团队还发布并开放有关底层训练方法,试图以较小额外成本换取性能跃升。业内人士认为,若上述路线在更广泛场景中得到验证,将推动大模型从“单一模型能力竞争”向“模型+系统工程能力竞争”转变,并加速产品化落地。 对策——以开源协同降低门槛、以标准化验证提升产业效率。杨植麟强调,开放技术有助于降低企业、研究者与普通用户获取智能能力的成本,进而形成共生生态、推动整体进步。在产业链层面,随着模型在软硬件适配、性能评测与工具链构建中的作用上升,统一、公开、可复现的基准体系将更受重视。通过开放模型与方法,更多机构可以在同一技术底座上开展研究与工程验证,减少重复投入,提升创新效率。同时,开源并不意味着放任无序,如何在开放共享与安全治理之间取得平衡,如何在数据合规、内容安全、应用边界等建立可执行的规则与流程,仍是产业健康发展的关键环节。 前景——研发范式或将迎来“任务由系统生成、研究由合力推进”的新阶段。杨植麟梳理了大模型训练路径的阶段演进:早期主要依赖互联网自然数据并辅以人工标注;随后强化学习体系的重要性上升,由人工筛选高质量任务、再通过系统化训练提升效果;未来几年,研究与研发方式可能发生更显著变化——研究人员将拥有更充足的Token资源,由智能系统自动合成新任务、构建新环境、优化奖励机制,甚至探索新的网络结构。在此趋势下,研发速度有望深入提升,科研与工程的边界将更紧密融合。业界同时指出,范式跃迁也将对人才结构与组织能力提出新要求:既需要理解基础理论与算法,也需要具备工程化、系统化与治理化能力;既要追求指标提升,也要重视可靠性、安全性与可控性。
人工智能研发模式的变革,标志着人类探索智能的方式正在转变;随着机器承担更多基础工作,研究者将聚焦更高层次的创新。这个进程机遇与挑战并存,如何在推动技术进步的同时确保可控发展,是行业长期思考的方向。