gtc 2026：高带宽的hbm4 还有液冷基建，估计得给ai的算力基础好好换个底

GTC 2026马上就在3月16日开了，这一次轮到存储领域来挑大梁。高带宽的HBM4还有液冷基建，估计得给AI的算力基础好好换个底。记得去年GTC的时候，现场那是人山人海，挤都挤不动。这次Rubin平台上配上HBM4，带宽比HBM3直接多了50%。这可是NVIDIA预热的信息，我以前在实验室搞过类似的内存测试。当时小李拿着样片特别激动，说这HBM4叠起来的数据量就像洪水一样冲过去，传输速率直接飙到2TB/s以上。不过啊，热量也跟着上来了，得赶紧上液冷方案，要不然芯片就得歇菜。为啥存储突然这么火？其实是因为AI训练那些大模型的时候，数据吞吐量大得吓人。HBM4也不是简单的升级，它是用3D堆叠技术一层层搭起来的。产业链那边就得跟上，像ABF基板这种封装材料必须耐高温高压。估计单颗HBM4的价值能翻个倍吧。再说液冷这块更实际一点。Rubin Ultra直接搞了个100%全液冷，单机柜功耗都能破200kW。想想以前的风冷在高负载下噪音大得跟拖拉机似的，效率还低30%。液冷就是靠冷却液循环散热，就像人体血管供血一样均匀多了。服务器房温度能稳稳控制在40度以下。有个工程师朋友前几天跟我说，液冷不光省电还能延长芯片寿命起码两年呢。这听着挺靠谱的。之前我以为PCB方面只是小修小补，结果后来一看测试照片才发现78层正交背板都成标配了。单颗价值是传统方案的5倍呢。高端PCB和覆铜板厂商要是不升级可不行。还有硅光CPO这东西肯定会加速这场变革，它能把铜缆给取代了，光引擎就像激光笔一样直射数据。说到用电问题啊，你用过那种高负载GPU吗？电费一个月顶我半年工资呢。粗略算一下200kW的机柜一年电费大概2万刀左右吧。液冷能省下20%的能耗这账还是划算的。现在的硅光技术也挺猛的，Quantum X3450 CPO交换机都量产了。单GPU配5.5个光引擎的那种感觉真的像科幻片一样。其实原理也不复杂就是把电信号变成光信号跑得更快嘛。我猜测HBM4大概能主导市场5到7年吧。平时训练AI的时候最烦的就是存储瓶颈卡住了。咱们3月16日那天会有主题演讲啊。发布Rubin平台、CPO光互联还有全液冷方案呢。整个生态投资我估计会超千亿刀吧。话说回来我对HBM4的带宽提升有没有啥特别的直觉？另一个问题是以后数据中心会不会变成水族馆啊？开玩笑的啦。细节上我翻了翻旧笔记发现Feynman架构推动了高带宽SRAM需求呢。底座重塑之后AI的能耗边界又该怎么打破呢？