人工智能硬件这一赛道最近冒出了个大新闻。你可能知道，最近全球在搞人工智能的人越来越多，大家对算力

人工智能硬件这一赛道最近冒出了个大新闻。你可能知道，最近全球在搞人工智能的人越来越多，大家对算力的需求也跟着疯涨。这时候，要想让行业往前推，硬件基础的创新就成了关键。有一家专门搞光子计算的美国初创公司Neurophos，最近把自家第一款光处理单元（OPU）“Tulkas T100”给发布出来了。这公司拿到了比尔·盖茨这样的大佬投资，他们路子挺野，想利用光来运算，打算彻底把芯片的效能边界给推倒重来。根据他们公布的消息，Tulkas T100最大的突破在于解决了光计算芯片没法实用化的老大难问题——元器件太大了。以前的硅光子工艺造的光晶体管，通常得有毫米那么大，这让芯片装不下多少晶体管，根本没法跟基于CMOS技术的传统数字芯片比。Neurophos有一套独门的微纳加工技术，硬是把光晶体管的体积缩小到了以前的万分之一。这个技术有多牛？这就意味着可以在一块芯片上密集集成一大堆光子传感器阵列。因为元器件变了那么小，Tulkas T100就能在芯片上塞进一个1000×1000的传感器矩阵。要是跟现在主流的GPU比，大多数GPU用的矩阵只有256×256。光从传感器阵列的规模看，Neurophos这款新芯片就实现了差不多15倍的提升。更有意思的是，现在很多现代GPU里面都有几十上百个张量核心（Tensor Core），但Neurophos的第一代加速器芯片里只有一个张量核心。这个核心的面积也就25平方毫米左右。他们说这个核心跑起来频率能达到惊人的56GHz，还配上了768GB的高带宽内存（HBM）。在性能这块数据挺吓人。公司说了，在处理FP4、INT4这种低精度格式的任务时，功耗跟英伟达最新的Vera Rubin NVL72平台差不多（也就是1到2千瓦），但性能能达到NVL72的10倍。理论上运算速度能冲到470 petaOPS（每秒千万亿次运算）。如果这个数据经得起严格验证，那绝对是人工智能算力效能的一次飞跃。业内人士觉得，光计算一直被看作是突破冯·诺依曼架构瓶颈的方向。它利用光信号来传输和处理数据，可能速度超快、延迟超低、功耗也低。不过啊，这种新兴技术要想变成产品可不容易。制造工艺、跟电子系统兼容、编程模型怎么搞、成本控制、还有长期靠不靠谱这些问题都得解决。现在英伟达这种基于传统半导体工艺的GPU已经在软硬件生态上筑起了很高的墙。新的技术路线要想商用，光性能好还不行，还得让别人用着顺手、稳定而且整体成本划算才行。 Neurophos发布Tulkas T100是值得关注的展示。它揭示了利用光子技术提升算力密度的新可能。比尔·盖茨投资它也说明资本市场很看重这种前沿技术的变革。不过从实验室走到数据中心变成主流还得经历很多考验。最后能不能成功改写芯片规则不光看技术本身，还得看能不能融入整个产业体系。这次进展肯定会让更多人去研究这些前沿技术，一起推动人工智能基础设施向更优方向发展。