4月23日,OpenAI正式发布GPT-5.5,这是他们迄今为止最强大的模型,也是自GPT-4.5以来首个完全重新预训练的基础模型。
这个版本的核心不是"更会聊天",而是能替你干活。
它能自主操作电脑、编写调试代码、分析数据、进行深度研究——这些正是知识工作者每天在做的事情。OpenAI联合创始人Greg Brockman说得直白:这个模型"只需要很少的引导,就能处理模糊问题,自己判断下一步该做什么"。
数字不会说谎
GPT-5.5的 benchmark 数据很能打:
(1) Terminal-Bench 2.0达到82.7%,超越Anthropic的Claude Mythos
(2) OSWorld测试78.7%,处理真实软件环境
(3) GDPval达到84.9%,这个指标衡量的是经济学家实际定价的工作任务
上下文窗口扩展到92.2万个token,可以直接丢进去一整个代码仓库或者上百页的合同。
每百万token定价5美元输入/30美元输出,是GPT-5.4的两倍。Plus用户有额度,Pro用户可以直接调用GPT-5.5 Pro——针对复杂推理专门优化过的版本。
超级App来了
Sam Altman和Greg Brockman一直在说的"超级App"愿景,GPT-5.5是最清晰的一步。ChatGPT、Codex、AI浏览器即将合并成一个产品,帮你写代码、分析数据、浏览网页、操作软件——一条龙服务。
这不只是一个聊天机器人,而是一个能替你打工的AI。
竞争格局
别以为OpenAI已经稳赢。Anthropic的Claude Opus 4.7在编程任务上仍然领先,Google的Gemini 3也在追赶。GPT-5.5真正的突破是在"AI自主干活"这件事上,把可用性和可靠性同时拉到了一个新的水位。
OpenAI首席科学家Jakub Pachocki说得更有意思:"过去两年其实挺慢的。"但他预计接下来进展会大幅提速。GPT-5.5只是开始。
这不是普通的版本迭代,是一个明确的信号:AI不再只是回答问题,而是帮你把活干完。程序员、分析师、研究员,这些职业受冲击最直接——但换个角度,第一个用上最强AI工具的人,优势也是最明显的。
AI时代真正来了,就在你还在犹豫要不要注册账号的时候。