最近苹果推出的iPhone 17 Pro给咱们带来了个大新闻,它居然在手机上跑起了拥有4000亿个参数的大语言模型。虽然让人觉得挺牛,但也让咱们看到了技术还没完全成熟。先来说说这台机器的配置吧,虽然它有厉害的A17芯片和12GB的LPDDR5X内存,可大多数超大模型动不动就需要超过200GB的内存才跑得动,这么一看,它的硬件资源确实挺紧巴的。不过科技这玩意儿总是充满惊喜的。这次能让模型跑起来的关键在于两项新技术:Flash-MoE和Mixture of Experts。Flash-MoE技术能让手机通过SSD来数据流传输数据,这样就把物理内存的限制给突破了。也就是说,iPhone 17 Pro需要的时候就能把SSD里的数据动态加载进来用,让处理能力大涨了不少。而MoE模型能让系统在生成每个词的时候,只用调用4000亿参数里的一部分就行,大大减轻了计算负担。不过这速度方面可就有点让人失望了。实测下来,这玩意儿每秒只能生成0.6个token,也就是每1.5到2秒才能产出一个词。这么慢的速度谁受得了?用户体验估计好不到哪儿去。 再加上长时间高强度运算对电池和散热也是个不小的考验,手机容易发烫、续航变差。但咱们也不能光看这些缺点啊,这事儿对行业来说意义重大。 首先最主要的好处是数据不用传到云端去了,隐私保护一下就上来了。没网络的时候你也能用顶级AI的回复功能,这给以后的手机应用指明了新方向。 行业里的Experts也都觉得这次演示很有潜力。只要算法再优化优化、硬件再迭代迭代,以后手机没准真能变成咱们随身携带的超级大脑。 要是现在的0.6 token能进化到60 token的时候那手机就不仅仅是个打电话的工具了。它会变成生活中不可缺少的智能助手。 总结来说吧iPhone 17 Pro这次突破展示了智能手机在算力上的潜力也引发了咱们对未来科技的思考。 怎么在保证性能的同时把体验提上去还真是厂商们得一起琢磨琢磨的难题。