openai 正在搞大动作,把自家的视频生成工具sora 深度嵌进chatgp 里头。

OpenAI正在搞大动作,把自家的视频生成工具Sora深度嵌进ChatGPT里头。这主要是为了应对谷歌Gemini带来的压力,毕竟那东西能生成视频,已经对ChatGPT造成威胁了。这次整合不仅仅是为了跟谷歌抢地盘,更是想把用户增长拉起来。听说团队已经在加班加点搞多模态适配了,功能很快就能用上。 话说回来,Gemini确实太猛了,靠着Veo AI技术让视频生成变成了家常便饭。再看ChatGPT那边的周活跃用户虽然已经有9.2亿,但离2023年定下的10亿目标还差那么点意思。所以管理层觉得给ChatGPT加点视频生成的技能包是激活增长的好路子。 回头再看Sora这产品,2024年2月刚露脸那会儿可是火得不行,直接把苹果App Store免费榜给冲了。可实际上这东西留不住人,现在的排名已经掉到了第165位。彭博社拿到的数据显示,真正愿意主动分享视频的用户连5%都不到。CEO奥尔特曼也在会上说过实话:光靠独立APP这种模式根本没法留住用户,必须得靠着ChatGPT的大流量池重新变现。 不过搞技术整合可不是件省心的事。要知道生成视频消耗的算力比做图片得要高三十倍以上,这让我想起了2023年3月那回服务器大崩溃。那会儿系统48小时内处理了2.3亿次请求,公司的计算资源一下子涨了470%。照The Information算下来,到了2030年光为了支撑新功能运行就得烧掉2250亿美元的推理成本。 其实这也反映了科技公司的那种焦虑感。就在半年前OpenAI还想在ChatGPT里直接开个购物功能来着,结果刚试了半年就被叫停了。这种"试错-止损"的模式说明他们想在维持技术领先和控制成本之间找平衡太难了。现在的ChatGPT早不是以前那种只写文章的工具了,它已经成了家居设计和服装定制领域的大杀器。 行业里的人都说这次整合其实是在拓展AI的应用场景。把视频生成变成聊天机器人的扩展功能就是想重新定义大家怎么看生成式AI。但挑战也不小:怎么在保证速度的同时把成本压下来?怎么不让功能叠得太乱影响体验?这些都得看团队的本事。 现在的局面很紧张,谷歌和Meta都在玩命搞多模态AI呢。这场围绕谁能抢下用户注意力的仗已经打到了白热化的地步。