阿里巴巴发布千问3.5-Plus大模型 参数效率创新突破推理性能跃升

问题:大模型产业发展进入深水区,单靠堆叠参数规模已难持续带来同等幅度的能力提升;随着政务、金融、制造、教育等领域对智能系统的需求上升,市场更关注“用不用得起、跑不跑得动、能否更可靠地完成复杂任务”。这个背景下,如何在算力与成本约束下提升推理效率、增强推理与多模态能力——并缩短从研发到应用的周期——成为行业普遍面临的关键课题。 原因:记者了解到,阿里巴巴此次开源的Qwen3.5-Plus在底层架构与训练范式上进行了系统升级。一上,模型采用混合架构走“总参数大、激活参数小”的效率路径:Qwen3.5-Plus总参数约3970亿,但单次激活约170亿,保持能力的同时显著降低部署资源占用。据介绍,其部署显存占用可降低约60%,在超长上下文等场景下推理吞吐量提升更明显。另一上,模型完成从纯文本到原生多模态的升级:相较此前以文本为主的预训练方式,新模型基于视觉与文本混合token进行预训练,并扩充中英文、多语种、STEM与推理等数据,使其在通用知识理解、逻辑推理与视觉理解等能力上更均衡。同时,团队在注意力机制、稀疏混合专家等方向叠加训练稳定性优化、多token预测等技术,提升推理效率与输出质量的整体表现。 影响:效率提升与能力增强的叠加,可能从供给侧与需求侧共同加快应用落地节奏。在供给侧,更低的资源占用意味着企业可在更广泛的硬件条件下部署模型,降低从试点到规模化上线的门槛;更高的推理吞吐有助于支撑高并发业务,改善交互时延与使用体验。在需求侧,原生多模态能力让模型更贴近真实业务的“图文并重”场景,如文档理解、图像问答、文本识别、视频理解等;更强的推理与编程能力,则有助于提升复杂任务处理的可靠性与可控性。公开信息显示,Qwen3.5-Plus在知识推理、难题测评、指令遵循与智能体评测等多个基准中取得较高分数,并在多模态推理、视觉问答、OCR与空间理解等评测中表现突出。业内人士指出,这类指标并不直接等同于实际业务效果,但可从侧面反映模型“通用能力底座”的提升,有利于缩短行业定制与二次开发周期。 对策:推动大模型走向可持续应用,仍需在“开放生态、成本治理、安全合规、工程化能力”上形成系统方案。其一,开放与可得性是产业扩散的重要前提。此次发布后,开发者可通过有关社区平台获取模型,也可通过云端服务调用接口,并提供更具竞争力的调用价格,有助于降低创新门槛,带动工具链与应用层发展。其二,面向企业落地,要同步补强工程与治理能力,包括长上下文性能稳定性、复杂任务链路的可追踪与可回滚机制、数据与内容安全策略、行业场景中的权限控制与审计等。其三,智能体应用的推广需要“能力—工具—流程”协同:模型不仅要会理解与推理,还要能在手机、电脑等终端上稳定执行多步骤操作,并具备跨应用数据整理、自动化流程执行等能力。相关信息显示,Qwen3.5-Plus在智能体能力上强调可扩展的异步强化学习框架与插件式扩展支持,这一方向有望提升复杂任务的端到端效率,但也对可靠性评估、异常处理与安全边界提出更高要求。 前景:从行业趋势看,大模型竞争正从“规模驱动”转向“效率与应用驱动”,从“单一文本能力”走向“多模态与智能体协同”。未来一段时间,围绕高效架构、长上下文、端侧与云端协同、工具调用与流程自动化的技术路线有望加速演进。随着开源与云服务并行推进,模型能力将更快触达中小企业与开发者群体,推动教育辅助、企业知识管理、内容生产、软件研发、客户服务等场景的产品化探索。同时,随着多模态与智能体深入应用,行业将更强调评测标准与真实业务指标的对齐,推动从“跑分”走向“可用、可控、可审计”的综合能力建设。

千问3.5的研发不仅反映了关键技术的进展,也折射出我国在人工智能领域的持续投入与积累。在全球数字化转型加速的背景下,持续推进核心技术攻关,促进人工智能与实体经济深度融合,将为高质量发展提供更强支撑。未来,随着更多成果落地与应用扩散,我国在全球人工智能产业与技术生态中的影响力有望深入提升。