OpenAI扔出一颗新炸弹。
4月23日,GPT-5.5正式发布,官方称之为"新一代智能,专为实际工作和AI代理而生"。
简单说:它能自主完成复杂任务——写代码、搜资料、分析数据,而且不用你一步步指挥,自己就能搞定。
几个关键数据:
(1) 编程测试Terminal-Bench 2.0,GPT-5.5得分82.7%,比上代GPT-5.4高出7.6个百分点。Claude Opus 4.7是69.4%,谷歌双子座3.1 Pro是68.5%。
(2) 最难数学题FrontierMath Tier 4,GPT-5.5拿到35.4%,Claude Opus 4.7是22.9%,双子座3.1 Pro只有16.7%。
(3) GPT-5.5 Pro版本更夸张,数学题冲到39.6%。
速度没变慢,延迟和GPT-5.4持平,但完成任务用的token更少——也就是说,实际费用比"价格翻倍"听起来要温和一些。
现在GPT-5.5和GPT-5.5 Pro已经向付费ChatGPT用户开放,Plus、Pro、商业版、企业版都能用。API接口稍后上线,价格是GPT-5.4的两倍。
这代模型的核心卖点不是"更会聊天",而是"更会替你干活"。OpenAI的意思很明确:以后那些重复性的知识工作,AI自己就能处理,你只需要下达目标。
不过有一点值得注意:测试机构Artificial Analysis发现,GPT-5.5的幻觉问题依然明显,偶尔会一本正经地胡说八道。用它处理重要任务,还需要人工复核。
性能确实上去了。但价格也上去了。这笔账,你自己算。
正文完