“拼积木”的小芯片时代才刚刚开始加速跑

当单芯片规模撞到物理极限的时候,半导体行业把所有组件全都焊死在一块晶圆上的模式算是到头了。过去几十年里,为了省电和高集成度,大家把 CPU、内存还有 AI 加速器全挤在一块 SoC 里。可现在芯片尺寸越来越小,良率直线掉、功耗蹭蹭往上涨,传统的做法显然不行了。再加上 AI 训练和推理产生的海量数据,光靠一个芯片跑不动,数据在芯片之间传输的时候变成了“耗电黑洞”,为了把庞大数据集挪过来挪过去,系统得烧掉大量电力还得花大力气散热,冷却成本甚至比算题本身还贵。 为了解决这个问题,“小芯片架构”(Chiplet)就出来了。这个法子简单说就是把大积木拆成小块乐高,把原本堆在一起的核心、I/O、AI 加速器这些模块分开制造,再用统一的接口拼接到一起。好处是哪块模块良品率低直接换了就行,不用赔整张晶圆;性能也能按需配,在最吃劲的地方用最强的核心,在省电的地方放低功耗模块;数据不用跑得那么远了,延迟和能耗也跟着降下来。 为了让不同厂商的小芯片能顺利对接,2022 年诞生了个叫“UCIe”的标准。这是个通用的芯片级高速互连协议,一口气把英特尔、AMD、ARM、谷歌、Meta、微软、高通还有三星、台积电这些巨头都拉进了同一个阵营。它的设计分层很灵活,能跟 PCIe、CXL、NVLink 这些现成的协议无缝对接,以后买 A 厂商的核心就能跟 B 厂商的加速器拼装在一起了。“标准”这东西一旦成了共识,就是降维打击。 HPC 这块地儿先试水了。橡树岭国家实验室搞的 Frontier 超级计算机就是用的 AMD EPYC 的 Trento CPU,把多颗小芯片封装成单板了。英伟达则是在一个大芯片上叠了两个 GPU 和一个 CPU,想靠堆层数来换算力。Cerebras 甚至直接做出了巨无霸级的大块头。更多的厂商还是选了小芯片加上 UCIe 这种拼乐高的路子。Cadence 测出来的数据显示,同样的封装尺寸下,小芯片方案的性能能翻三倍、功耗能降十倍,性价比太明显了。 当二维平面装不下更多晶体管的时候,三维封装就成了新战场。通过在 Z 轴方向把小芯片叠起来计算密度就直线上升了。这种堆叠还能支持异构结构——把 AI 加速器放在最顶层、高速缓存放中间、功耗低的控制模块放底层,做到“算力下沉、功耗上移”。当然三维堆叠也带来了散热、成本和良率的难题;不过大家都觉得这种可拆卸、可升级的摩天楼式架构才是未来十年最稳当的路子。 现在这生态还在早期阶段,但抢标准就是抢入场券。UCIe 普及的快慢决定了谁赢谁输:早入局的能锁定客户和产能;观望的可能就面临生态封闭、投资打水漂的风险。Mayank Bhatnaga 说得很直白:“一旦大家都跑在同一套标准上,UCIe 就从‘加分项’变成‘准入门槛’了。”随着产业链的人一起推 UCIe,生态雪球越滚越大。下一个十年没有 UCIe 的芯片组肯定会被市场淘汰。 说到底,“拼积木”的小芯片时代才刚刚开始加速跑呢!