2026年3月我国日均词元调用量已超140 万亿

要说中国这个AI热潮里,Token这个概念的地位可是越来越受重视了。它是榜单上的大模型调用量评估标准,也是厂商给客户的套餐计费单位。2026年3月22日到23日的中国发展高层论坛上,国家数据局局长刘烈宏特别强调,Token“词元”是智能时代的价值锚点,同时也是技术供给和商业需求之间的结算单位。这个定义从官方角度给Token给出了个新名字:词元。 3月24日国新办的新闻发布会上,刘烈宏透露,今年3月我国日均词元调用量已经超过了140万亿。相比2024年初才1000亿的情况,增长了足足一千多倍。再和2025年底100万亿的数据比,这三个月又增长了40%多。他认为这个快速增长证明了中国AI发展进入了快车道。因为应用场景越来越丰富,从只能对话到能做决策执行的智能体都有了,中国AI产业的竞争力自然就更强了。现在大家热议的Token出海,就是这个竞争力提升的一个表现。 不过,建设高质量数据集可是一个很重要的基础。刘烈宏说各方一起努力下,我国高质量数据集建设工作也取得了阶段性成效。到2025年底全国已经建成了超过10万个高质量数据集,总量超过890PB呢。这个数量相当于中国国家图书馆数字资源总量的310倍左右。接下来国家数据局还会继续推进数据赋能AI创新发展,实施新一轮行动计划来提高高质量数据集供给的量和质。 那么什么是Token?在AI世界里它就是模型处理信息的最小单位。无论是你提的问题还是AI生成的代码,最终都会被拆解成Token来运算。所以Token调用量直接反映了AI模型活跃度和产业价值。调用量越多说明模型被用得越频繁,创造的实际价值自然也就越大了。 2024年刚开始的时候我们只有1000亿的词元调用量呢。到了2025年年底变成了100万亿。而到了2026年3月已经超过了140万亿!这个增长速度实在是惊人!未来几年我们还要继续加大数据建设力度,打造更多实用便捷、质量保障的AI-Ready高质量数据集。 另外再给大家普及下一个概念:PB(即拍字节)。比如我们国家已经建成的高质量数据集总量就有890PB这么多呢!这相当于国家图书馆数字资源总量的310倍左右哦!想象一下这个数字有多大吧? 总之这次论坛和发布会传递出一个非常明确的信号:中国在AI领域正朝着更加先进、更具竞争力的方向迈进!