理想汽车发布端侧大模型协同设计定律，破解芯片与算法效能失配难题

问题——端侧大模型落地遭遇“峰值强、实跑弱” 近年来，大模型从云端向手机、汽车等端侧迁移，带来更强的交互与认知能力想象空间。但在车载场景中，理论算力充裕并不等同于体验提升：芯片峰值指标不断刷新，模型参数规模持续扩展，部署到实际系统后却常出现资源利用率不高、延迟与功耗压力加大等现象。一些工程团队在迭代中感受到“硬件在等数据、软件在等资源”的空转，传统依靠堆叠硬件与参数的路径边际收益递减。原因——算力演进节奏与算法扩张方式错位业内人士指出，车载环境对成本、散热、供电与可靠性提出刚性约束，决定了车端无法像数据中心那样不计代价扩展算力。同时，模型能力提升越来越依赖更复杂的结构设计与更高的内存访问效率，单纯提高TOPS并不能同步带来等比例的端到端性能增益。更深层的矛盾在于：硬件能力通常以相对线性的方式演进，而算法和模型复杂度往往呈加速扩张，二者节奏错位导致“能跑起来”与“跑得高效”之间存在鸿沟。全球科技企业近年强调“协同设计”的趋势，也从侧面反映了该挑战的普遍性。影响——竞争焦点从“算力规模”转向“系统效率” 随着智能辅助驾驶向更高阶演进，车载系统需要同时处理感知、决策、规划与交互等多任务负载，业界对视觉-语言-行动等融合模型的探索不断加快。基于此，行业竞争正在从“谁能装更强芯片”逐步转向“谁能把芯片能力用到位”。如果软硬适配仍以经验试错为主，不仅研发周期拉长、工程成本抬升，也会影响功能迭代速度与规模化落地，进而形成端侧智能普及的隐性障碍。对策——用数学建模把协同设计从理念变为可预测工具据理想汽车介绍，其基座模型团队与国创决策智能技术研究所联合提出端侧大模型“软硬协同设计定律”，尝试将模型精度、结构参数与硬件特性之间的关系以可量化方式表达。研发团队基于多种模型架构开展训练与评估，建立精度与架构参数之间的拟合关系；同时引入计算机体系结构中常用的性能分析方法，面向车载推理特点，对注意力机制、缓存占用、稀疏路由等关键负载对内存系统的影响进行建模。在此基础上形成PLAS架构搜索框架：在给定芯片算力、带宽、缓存等参数以及延迟、功耗等工程约束条件下，自动搜索更具性价比的模型结构方案。从工程角度看，这一做法的核心价值在于减少“摸着石头过河”。以往芯片升级或模型换代往往需要较长时间的选型、适配与调优；通过建立可计算、可验证的设计依据，有望将适配周期压缩，并在同等硬件条件下提升真实吞吐与能效，为大规模上车提供更稳定的路径。前景——反向牵引芯片架构演进，推动产业从“堆料”走向“协同” 研究团队提出的若干结论对未来车载芯片与模型演进具有启示意义：其一，端侧推理天然适合稀疏计算，芯片需更好支持“按需激活、择优计算”；其二，相比单一算力指标，内存带宽、缓存效率及数据搬运开销更可能成为决定性瓶颈；其三，模型在理解输入与生成输出等不同阶段对资源需求差异明显，要求系统具备更灵活的调度与资源分配能力；其四，一些长期沿用的结构比例与配置习惯在车载场景下未必最优，需要以端侧约束为导向重新审视。业内预计，随着端侧智能应用深化，围绕模型、编译器、运行时与芯片架构的协同将加速形成方法论沉淀，并可能推动更可对比的评价体系与工程标准出现。

当技术创新从单点突破转向系统优化，理想汽车引领的效率革命揭示出重要产业规律：在智能化进程中，对技术本质的数学化认知与跨学科协同，可能比单纯技术迭代更具战略价值；这既是中国车企的重要机遇，也为全球智能产业发展提供了新思路。