2026年3月我国日均词元调用量已超140 万亿

要说中国这个AI热潮里，Token这个概念的地位可是越来越受重视了。它是榜单上的大模型调用量评估标准，也是厂商给客户的套餐计费单位。2026年3月22日到23日的中国发展高层论坛上，国家数据局局长刘烈宏特别强调，Token“词元”是智能时代的价值锚点，同时也是技术供给和商业需求之间的结算单位。这个定义从官方角度给Token给出了个新名字：词元。 3月24日国新办的新闻发布会上，刘烈宏透露，今年3月我国日均词元调用量已经超过了140万亿。相比2024年初才1000亿的情况，增长了足足一千多倍。再和2025年底100万亿的数据比，这三个月又增长了40%多。他认为这个快速增长证明了中国AI发展进入了快车道。因为应用场景越来越丰富，从只能对话到能做决策执行的智能体都有了，中国AI产业的竞争力自然就更强了。现在大家热议的Token出海，就是这个竞争力提升的一个表现。不过，建设高质量数据集可是一个很重要的基础。刘烈宏说各方一起努力下，我国高质量数据集建设工作也取得了阶段性成效。到2025年底全国已经建成了超过10万个高质量数据集，总量超过890PB呢。这个数量相当于中国国家图书馆数字资源总量的310倍左右。接下来国家数据局还会继续推进数据赋能AI创新发展，实施新一轮行动计划来提高高质量数据集供给的量和质。那么什么是Token？在AI世界里它就是模型处理信息的最小单位。无论是你提的问题还是AI生成的代码，最终都会被拆解成Token来运算。所以Token调用量直接反映了AI模型活跃度和产业价值。调用量越多说明模型被用得越频繁，创造的实际价值自然也就越大了。 2024年刚开始的时候我们只有1000亿的词元调用量呢。到了2025年年底变成了100万亿。而到了2026年3月已经超过了140万亿！这个增长速度实在是惊人！未来几年我们还要继续加大数据建设力度，打造更多实用便捷、质量保障的AI-Ready高质量数据集。另外再给大家普及下一个概念：PB（即拍字节）。比如我们国家已经建成的高质量数据集总量就有890PB这么多呢！这相当于国家图书馆数字资源总量的310倍左右哦！想象一下这个数字有多大吧？总之这次论坛和发布会传递出一个非常明确的信号：中国在AI领域正朝着更加先进、更具竞争力的方向迈进！