GPT-5.5正式发布:OpenAI逼近AI超级应用,基准测试超越Claude

4次阅读

OpenAI 扔出今年最重磅的一颗炸弹。

4月23日,这家公司正式发布 GPT-5.5。在基准测试 Terminal-Bench 2.0 上,它以微弱优势击败了劲敌 Anthropic 的 Claude Mythos Preview——后者被认为是当时最强大的 AI 模型。这场胜利来得不轻松,但 OpenAI 拿到了。

更重要的是,GPT-5.5 已经不是单纯聊天的工具了。它直接驱动 OpenAI 的王牌产品 Codex,并已落地英伟达的企业基础设施。英伟达自己也在用 GPT-5.5 干活。

超级应用近了

TechCrunch 用了「super app」这个词形容 OpenAI 的野心。GPT-5.5 的定位不只是对话,而是能替代一整套工作流——写代码、分析数据、处理文件、帮你做决策。OpenAI 想让你打开一个入口,所有事情都它搞定。

这种思路和微信超级应用有点像,只不过这次主角换成了 AI。

GPT-5.5 同时登陆微软 Azure Foundry,面向企业用户开放。Azure 的企业客户现在可以直接调用 GPT-5.5 的能力,不需要自己维护模型。

性能提升了多少

这次 OpenAI 没有公布具体参数规模,但基准测试结果足够说明问题:

(1) Terminal-Bench 2.0 超越 Claude Mythos Preview
(2) 英伟达基础设施驱动,推理速度大幅提升
(3) 企业级部署,直接集成进微软 Azure

如果你是开发者或企业用户,这代产品的吸引力比之前任何一代都强。

格局变了

Anthropic、OpenAI、Google 三家今年的竞争已经白热化。Claude 系列一直以「更安全、更对齐」著称,这次被 GPT-5.5 稍微超过,说明单纯的安全牌还不够——性能同等重要。

普通用户什么时候能用上?按照 OpenAI 的节奏,消费级产品上线大约还要等几个季度。但 GPT-5.5 的能力通过 API 和企业渠道已经开始流通。

AI 军备竞赛还在加速,这一次 OpenAI 暂时领先了半个身位。

正文完
 0