OpenAI 扔出今年最重磅的一颗炸弹。
4月23日,这家公司正式发布 GPT-5.5。在基准测试 Terminal-Bench 2.0 上,它以微弱优势击败了劲敌 Anthropic 的 Claude Mythos Preview——后者被认为是当时最强大的 AI 模型。这场胜利来得不轻松,但 OpenAI 拿到了。
更重要的是,GPT-5.5 已经不是单纯聊天的工具了。它直接驱动 OpenAI 的王牌产品 Codex,并已落地英伟达的企业基础设施。英伟达自己也在用 GPT-5.5 干活。
超级应用近了
TechCrunch 用了「super app」这个词形容 OpenAI 的野心。GPT-5.5 的定位不只是对话,而是能替代一整套工作流——写代码、分析数据、处理文件、帮你做决策。OpenAI 想让你打开一个入口,所有事情都它搞定。
这种思路和微信超级应用有点像,只不过这次主角换成了 AI。
GPT-5.5 同时登陆微软 Azure Foundry,面向企业用户开放。Azure 的企业客户现在可以直接调用 GPT-5.5 的能力,不需要自己维护模型。
性能提升了多少
这次 OpenAI 没有公布具体参数规模,但基准测试结果足够说明问题:
(1) Terminal-Bench 2.0 超越 Claude Mythos Preview
(2) 英伟达基础设施驱动,推理速度大幅提升
(3) 企业级部署,直接集成进微软 Azure
如果你是开发者或企业用户,这代产品的吸引力比之前任何一代都强。
格局变了
Anthropic、OpenAI、Google 三家今年的竞争已经白热化。Claude 系列一直以「更安全、更对齐」著称,这次被 GPT-5.5 稍微超过,说明单纯的安全牌还不够——性能同等重要。
普通用户什么时候能用上?按照 OpenAI 的节奏,消费级产品上线大约还要等几个季度。但 GPT-5.5 的能力通过 API 和企业渠道已经开始流通。
AI 军备竞赛还在加速,这一次 OpenAI 暂时领先了半个身位。