我想问一句,“豆包电脑”真的来了?大家心心念念的GPT-5.4就这么猝不及防地发布了。虽然版本号上只多了0.2,但升级力度可是相当硬核。它把GPT-5.3-Codex这个编程大杀器、最新的推理能力,还有大家都在盼着的原生电脑操作支持统统打包进来了。最关键的是,这么多东西塞进去居然还没把性能拖垮,真的很牛。 说到核心能力——直接在电脑上操作,现在的GPT-5.4简直跟真人一样,能看懂屏幕截图,识别出UI元素,然后该点哪就点哪、该拖哪就拖哪。 OpenAI说它能处理100万个上下文Token,特别适合干那种超长的任务链。在那个OSWorld-Verified的测试里,GPT-5.4直接跑出了75.0%的成功率。这不仅把前代的47.3%远远甩在了身后,甚至还超过了人类72.4%的平均水平。 专业领域的表现也不错。GDPval测试里,GPT-5.4在83.0%的项目上追上了行业的标准,比GPT-5.2多了70.9%。特别是那个金融分析电子表格的建模测试,GPT-5.4给出了87.3%的平均分,比上一代的68.4%高出了不少。OpenAI解释说,大家更喜欢它输出的表格,是因为它的“美学”更好了。 至于ChatGPT那边,现在也多了个“思考过程预览”的功能。你运行复杂任务的时候,它会先把推理思路和过程给你看。这样你就不用干等结果出来后再发现它跑偏了。 价格方面自然是涨了,但好处是处理效率更高了。根据OpenAI的计划,GPT-5.4 Thinking马上就会给ChatGPT Plus、Team和Pro用户用了。Enterprise版本的GPT-5.4 Pro也会给Pro和Enterprise用户开放。