GTC 2026马上就在3月16日开了,这一次轮到存储领域来挑大梁。高带宽的HBM4还有液冷基建,估计得给AI的算力基础好好换个底。记得去年GTC的时候,现场那是人山人海,挤都挤不动。这次Rubin平台上配上HBM4,带宽比HBM3直接多了50%。这可是NVIDIA预热的信息,我以前在实验室搞过类似的内存测试。当时小李拿着样片特别激动,说这HBM4叠起来的数据量就像洪水一样冲过去,传输速率直接飙到2TB/s以上。不过啊,热量也跟着上来了,得赶紧上液冷方案,要不然芯片就得歇菜。为啥存储突然这么火?其实是因为AI训练那些大模型的时候,数据吞吐量大得吓人。HBM4也不是简单的升级,它是用3D堆叠技术一层层搭起来的。 产业链那边就得跟上,像ABF基板这种封装材料必须耐高温高压。估计单颗HBM4的价值能翻个倍吧。再说液冷这块更实际一点。Rubin Ultra直接搞了个100%全液冷,单机柜功耗都能破200kW。想想以前的风冷在高负载下噪音大得跟拖拉机似的,效率还低30%。液冷就是靠冷却液循环散热,就像人体血管供血一样均匀多了。服务器房温度能稳稳控制在40度以下。有个工程师朋友前几天跟我说,液冷不光省电还能延长芯片寿命起码两年呢。这听着挺靠谱的。 之前我以为PCB方面只是小修小补,结果后来一看测试照片才发现78层正交背板都成标配了。单颗价值是传统方案的5倍呢。高端PCB和覆铜板厂商要是不升级可不行。还有硅光CPO这东西肯定会加速这场变革,它能把铜缆给取代了,光引擎就像激光笔一样直射数据。 说到用电问题啊,你用过那种高负载GPU吗?电费一个月顶我半年工资呢。粗略算一下200kW的机柜一年电费大概2万刀左右吧。液冷能省下20%的能耗这账还是划算的。 现在的硅光技术也挺猛的,Quantum X3450 CPO交换机都量产了。单GPU配5.5个光引擎的那种感觉真的像科幻片一样。其实原理也不复杂就是把电信号变成光信号跑得更快嘛。 我猜测HBM4大概能主导市场5到7年吧。平时训练AI的时候最烦的就是存储瓶颈卡住了。 咱们3月16日那天会有主题演讲啊。发布Rubin平台、CPO光互联还有全液冷方案呢。 整个生态投资我估计会超千亿刀吧。 话说回来我对HBM4的带宽提升有没有啥特别的直觉? 另一个问题是以后数据中心会不会变成水族馆啊?开玩笑的啦。 细节上我翻了翻旧笔记发现Feynman架构推动了高带宽SRAM需求呢。 底座重塑之后AI的能耗边界又该怎么打破呢?