gpt-5.4的“美学”

我想问一句，“豆包电脑”真的来了？大家心心念念的GPT-5.4就这么猝不及防地发布了。虽然版本号上只多了0.2，但升级力度可是相当硬核。它把GPT-5.3-Codex这个编程大杀器、最新的推理能力，还有大家都在盼着的原生电脑操作支持统统打包进来了。最关键的是，这么多东西塞进去居然还没把性能拖垮，真的很牛。说到核心能力——直接在电脑上操作，现在的GPT-5.4简直跟真人一样，能看懂屏幕截图，识别出UI元素，然后该点哪就点哪、该拖哪就拖哪。 OpenAI说它能处理100万个上下文Token，特别适合干那种超长的任务链。在那个OSWorld-Verified的测试里，GPT-5.4直接跑出了75.0%的成功率。这不仅把前代的47.3%远远甩在了身后，甚至还超过了人类72.4%的平均水平。专业领域的表现也不错。GDPval测试里，GPT-5.4在83.0%的项目上追上了行业的标准，比GPT-5.2多了70.9%。特别是那个金融分析电子表格的建模测试，GPT-5.4给出了87.3%的平均分，比上一代的68.4%高出了不少。OpenAI解释说，大家更喜欢它输出的表格，是因为它的“美学”更好了。至于ChatGPT那边，现在也多了个“思考过程预览”的功能。你运行复杂任务的时候，它会先把推理思路和过程给你看。这样你就不用干等结果出来后再发现它跑偏了。价格方面自然是涨了，但好处是处理效率更高了。根据OpenAI的计划，GPT-5.4 Thinking马上就会给ChatGPT Plus、Team和Pro用户用了。Enterprise版本的GPT-5.4 Pro也会给Pro和Enterprise用户开放。