一、问题:应用热度快速上行,算力供需矛盾再受关注 3月6日,A股算力租赁概念延续强势,对应的个股交投活跃。盘面显示,南网数字一度触及20%涨停,协鑫能科、金开新能、中国能建等涨停,国网信通、天亿马、中贝通信等跟随上涨。市场普遍认为,这轮行情与大模型调用量增长、企业端智能体加速落地带来的推理算力需求扩张有关。 算力是数字经济的重要底座,其供给结构、调度能力和成本变化正成为行业关注点。推理需求快速上行的背景下,算力租赁、算力调度、数据中心及相关能源保障环节受到资金追踪,也反映出市场对阶段性“算力紧平衡”可能再现的预期。 二、原因:调用量与智能体扩张叠加,推理端需求更具弹性 从应用端看,模型调用量是观察产业景气度的直接指标。全球模型API聚合平台OpenRouter统计显示,2月9日至15日当周,中国模型调用量约4.12万亿Token,首次超过同期美国模型约2.94万亿Token;2月16日至22日当周,中国模型调用量深入升至约5.16万亿Token,延续放量趋势。,调用量排名前五的模型中有四款来自中国厂商,合计贡献Top5总调用量的八成以上,显示我国模型在海外开发者和应用端的渗透率提升。 从产业趋势看,多家机构对“智能体”扩张给出更高的增长预期。IDC相关报告认为,中国企业活跃智能体数量未来或将大幅增长,到2031年可能突破3.5亿;随着任务执行频次提升、任务复杂度上升,Token消耗存在加速增长的可能。与训练算力相比,推理算力更贴近真实业务负载,增长节奏更依赖应用落地速度。一旦企业将智能体嵌入客服、营销、研发、供应链、风控等核心流程,算力需求就可能从“试点”转为持续、常态调用,从而抬升对供给弹性与成本控制的要求。 此外,全球产业链也在推动推理成本下降。国际芯片厂商近期公开表示,推理侧单Token成本仍在下行,更多应用场景因此具备经济可行性。成本下降往往会带动需求扩张,进一步打开算力基础设施的增量空间。 三、影响:资本市场提前定价,产业链从“扩资源”转向“比效率” 在资本市场层面,算力租赁板块走强,一上反映对订单与利用率改善的预期,另一方面也提示行业正从“堆资源”转向“拼效率”。对算力提供方而言,盈利能力不只取决于机柜与GPU规模,还取决于电力保障、散热能效、网络互联、调度软件以及运维服务水平;对使用方而言,评价投入产出比的重点也从“模型能力”延伸到“单位成本下的稳定吞吐”和“端到端响应时延”。 在实体经济层面,算力需求上行将对数据中心建设、绿色电力消纳、算网协同以及安全合规提出更高要求。尤其在“东数西算”和新型电力系统建设持续推进的背景下,算力与电力、算力与网络的协同优化,将直接影响产业扩张的速度与质量。 同时,调用量提升也会倒逼模型能力迭代。高并发、长链路、多工具调用等复杂任务,将工程化能力、推理优化与模型稳定性推到更关键的位置,促使行业加快向“产品化、平台化”演进。 四、对策:以供需匹配为主线,提升算力可用性与可持续性 业内人士建议,供给侧应加快高效算力基础设施建设与改造,推动数据中心绿色低碳转型,提升PUE水平,强化电力保障与峰谷调度能力;通过算网协同和统一调度平台建设,提高跨区域算力的可达性与可用性,降低“有算力但不可用、可用但不经济”等摩擦成本。 需求侧上,企业推进智能体与大模型落地,应优先聚焦高价值、可量化的业务环节,建立模型调用监控、成本核算与安全治理机制,避免盲目扩张造成资源浪费与合规风险。金融、政务、能源等关键行业还需同步完善数据安全、内容安全与业务连续性保障,沉淀可复制的行业解决方案。 产业生态方面,可鼓励软硬件协同优化,推进推理加速、编排框架、模型压缩与工具链完善,提高单位算力的有效产出,形成以效率为导向的竞争格局。 五、前景:调用量优势正在形成,关键在于“持续创新+规模落地” 相关数据体现出我国大模型在调用量与产品覆盖上的积极变化,但全球竞争仍集中在基础研究、工程化能力、生态构建与商业闭环等综合维度。未来一段时间,随着智能体加速渗透企业流程,推理需求或将维持高景气;算力租赁与算力服务也有望从“阶段性供需波动”走向“长期运营能力竞争”。能否在成本、能效、稳定性与安全合规之间取得平衡,将决定企业在新一轮产业周期中的位置。
这场由技术创新驱动的产业变革,既考验我国数字经济的底层支撑能力,也检验在高质量发展背景下推进科技自立自强的韧性与耐力;当算力逐步成为与电力类似的基础生产要素,其背后的技术攻关与生态建设,可能重塑未来十年的国际竞争格局。