在这次英伟达的GTC大会上,黄仁勋讲了一件挺有意思的事:Token现在变成了AI的新“石油”。推理本来就是大模型的核心工作,现在大家都在抢这个位置,谁掌握Token谁就掌握了主动权。这个Token到底是什么?简单点说就是AI处理信息的最小单位,一个汉字大概等于一到两个Token。前两年大家只看模型参数大小、跑得多深、benchmark成绩怎么样,现在已经不一样了,Token消耗量已经成了新的比拼标准。春节后Agent AI的玩法变了,以前是回答问题,现在是让AI自己去干事情。比如OpenClaw这种智能体,你只要告诉它目标,它就会自己拆分成任务去做,一次复杂的任务就能烧掉几十万甚至几百万Token。这么一来,数据中心也跟着变样了,从以前的文件仓库变成了“Token工厂”。 最近有个叫OpenRouter的平台在3月16日公布了最新数据:中国大模型的调用量已经连续两周超过美国了。在全球前10名的模型里,中国占了4个位置而且全在前三位。中国模型一共调用了4.69万亿个Token,比上一周多了11.82%;美国那边只有3.294万亿个,反而少了9.33%。这个平台主要面向海外开发者,把GPT-4、Claude这些主流模型都整合在一起了。因为每天处理的都是真实调用数据,所以它的排行榜很有参考价值。不少业内人士都觉得Token确实开始走向海外了。 黄仁勋说得很直白:未来大家都会用“AI工厂效率”来衡量自己的水平。说白了就是同样花100万Token的钱,谁能用更短的时间搞定任务?同样的算力成本下,谁能产出更多高质量的Token?这事儿不简单,不光要看芯片和算力本身,还要看模型、路由、缓存这些怎么配合才行。Token经济学可不是简单的算账游戏,而是AI时代的新工业革命语言。谁能看懂、用好这套规则,谁就能在下一轮竞争里领先别人。