人工智能硬件这一赛道最近冒出了个大新闻。你可能知道,最近全球在搞人工智能的人越来越多,大家对算力的需求也跟着疯涨。这时候,要想让行业往前推,硬件基础的创新就成了关键。 有一家专门搞光子计算的美国初创公司Neurophos,最近把自家第一款光处理单元(OPU)“Tulkas T100”给发布出来了。这公司拿到了比尔·盖茨这样的大佬投资,他们路子挺野,想利用光来运算,打算彻底把芯片的效能边界给推倒重来。 根据他们公布的消息,Tulkas T100最大的突破在于解决了光计算芯片没法实用化的老大难问题——元器件太大了。以前的硅光子工艺造的光晶体管,通常得有毫米那么大,这让芯片装不下多少晶体管,根本没法跟基于CMOS技术的传统数字芯片比。Neurophos有一套独门的微纳加工技术,硬是把光晶体管的体积缩小到了以前的万分之一。这个技术有多牛?这就意味着可以在一块芯片上密集集成一大堆光子传感器阵列。 因为元器件变了那么小,Tulkas T100就能在芯片上塞进一个1000×1000的传感器矩阵。要是跟现在主流的GPU比,大多数GPU用的矩阵只有256×256。光从传感器阵列的规模看,Neurophos这款新芯片就实现了差不多15倍的提升。 更有意思的是,现在很多现代GPU里面都有几十上百个张量核心(Tensor Core),但Neurophos的第一代加速器芯片里只有一个张量核心。这个核心的面积也就25平方毫米左右。他们说这个核心跑起来频率能达到惊人的56GHz,还配上了768GB的高带宽内存(HBM)。 在性能这块数据挺吓人。公司说了,在处理FP4、INT4这种低精度格式的任务时,功耗跟英伟达最新的Vera Rubin NVL72平台差不多(也就是1到2千瓦),但性能能达到NVL72的10倍。理论上运算速度能冲到470 petaOPS(每秒千万亿次运算)。 如果这个数据经得起严格验证,那绝对是人工智能算力效能的一次飞跃。 业内人士觉得,光计算一直被看作是突破冯·诺依曼架构瓶颈的方向。它利用光信号来传输和处理数据,可能速度超快、延迟超低、功耗也低。 不过啊,这种新兴技术要想变成产品可不容易。制造工艺、跟电子系统兼容、编程模型怎么搞、成本控制、还有长期靠不靠谱这些问题都得解决。 现在英伟达这种基于传统半导体工艺的GPU已经在软硬件生态上筑起了很高的墙。新的技术路线要想商用,光性能好还不行,还得让别人用着顺手、稳定而且整体成本划算才行。 Neurophos发布Tulkas T100是值得关注的展示。它揭示了利用光子技术提升算力密度的新可能。比尔·盖茨投资它也说明资本市场很看重这种前沿技术的变革。 不过从实验室走到数据中心变成主流还得经历很多考验。最后能不能成功改写芯片规则不光看技术本身,还得看能不能融入整个产业体系。 这次进展肯定会让更多人去研究这些前沿技术,一起推动人工智能基础设施向更优方向发展。