GPT-5.5跑分登顶：OpenAI说这是"新智能级别"，但价格也翻倍了

OpenAI扔出一颗新炸弹。

4月23日，GPT-5.5正式发布，官方称之为"新一代智能，专为实际工作和AI代理而生"。

简单说：它能自主完成复杂任务——写代码、搜资料、分析数据，而且不用你一步步指挥，自己就能搞定。

几个关键数据：

(1) 编程测试Terminal-Bench 2.0，GPT-5.5得分82.7%，比上代GPT-5.4高出7.6个百分点。Claude Opus 4.7是69.4%，谷歌双子座3.1 Pro是68.5%。

(2) 最难数学题FrontierMath Tier 4，GPT-5.5拿到35.4%，Claude Opus 4.7是22.9%，双子座3.1 Pro只有16.7%。

(3) GPT-5.5 Pro版本更夸张，数学题冲到39.6%。

速度没变慢，延迟和GPT-5.4持平，但完成任务用的token更少——也就是说，实际费用比"价格翻倍"听起来要温和一些。

现在GPT-5.5和GPT-5.5 Pro已经向付费ChatGPT用户开放，Plus、Pro、商业版、企业版都能用。API接口稍后上线，价格是GPT-5.4的两倍。

这代模型的核心卖点不是"更会聊天"，而是"更会替你干活"。OpenAI的意思很明确：以后那些重复性的知识工作，AI自己就能处理，你只需要下达目标。

不过有一点值得注意：测试机构Artificial Analysis发现，GPT-5.5的幻觉问题依然明显，偶尔会一本正经地胡说八道。用它处理重要任务，还需要人工复核。

性能确实上去了。但价格也上去了。这笔账，你自己算。

近期文章