阿里发布了一款高级推理大模型

我国人工智能研发有了新的进展,阿里巴巴集团发布了一款高级推理大模型。这个模型叫Qwen3-Max-Thinking,它在数学推理、科学知识问答、编程能力还有复杂工具调用这些方面都表现得特别好。阿里的技术报告显示,这个模型在19项权威的国际基准测试中都取得了好成绩,甚至和OpenAI的GPT-5.2-Thinking、谷歌的Gemini 3 Pro这些顶尖模型比起来也不逊色。这次发布的Qwen3-Max-Thinking不是简单地增加参数规模,而是在两个关键技术能力上取得了突破。一个是自适应工具调用能力,它能根据上下文和任务性质,自动调用内置的搜索引擎、代码解释器还有记忆增强等工具。比如,在回答政策咨询的时候,模型会自动搜索最新的信息。在复杂计算或者逻辑验证的时候,它会启动代码解释器执行运算。这样做不仅让交互更自然流畅,还能减少生成不实信息的风险。另一个是测试时扩展技术,它通过更智能地分配计算资源来提升性能。传统大模型可能会尝试很多种推理路径,有些重复或者低效计算浪费了算力。Qwen3-Max-Thinking引入了反思机制,让它能聚焦于尚未解决的难点优化计算路径。这样一来,在同等算力下它能更高效地进行推理。 这个模型在HLE基准测试中取得了领先分数,在数学奥林匹克竞赛级别推理测试中表现也不错。预览版本甚至在部分顶尖数学竞赛试题上拿了满分。这些结果说明它处理极端复杂任务很有潜力。 现在普通用户可以免费体验基础功能,企业开发者也能通过阿里云获取专业服务把它集成到商业解决方案里。这有助于加速AI技术从实验室走向各行各业。 这次技术突破背后是阿里巴巴持续加码人工智能基础设施建设的决心。吴泳铭CEO表示公司正推进三年大规模投资计划并会持续追加投入。 阿里巴巴千问最新旗舰模型发布了我国在高阶大模型推理能力上追赶世界水平的可能性。这个方向也为未来AI融入实体经济提供了重要路径。面对全球竞争格局持续投入和开放协同生态是我国把握主动权的关键所在。