数学考试从65分暴涨到81分,幻觉率在法律、医学、金融领域大幅下降。这是OpenAI本周发布的GPT-5.5 Instant交出的成绩单——它已经成为ChatGPT新的默认模型。
5月5日,OpenAI正式推出GPT-5.5 Instant,取代了此前的GPT-5.3 Instant。作为默认模型,所有免费和付费用户都会自动用上新版。
新模型在数学能力上提升明显。AIME 2025数学测试中拿到了81.2分,而上一代只有65.4分。多模态推理 benchmark MMMU-Pro 也从69.2升到76。
但这次升级最实用的改进,是"幻觉率"下降。OpenAI特别提到,在法律、医学、金融这些敏感领域,AI胡编乱造的问题得到了控制——这三个领域最怕的就是一本正经地胡说八道。
另一个实用功能:上下文记忆。现在ChatGPT可以调取你的历史对话、文件和Gmail邮件,给出更精准的个性化回答。比如你上周问过的项目参数,直接接着聊就行,不用重来一遍。这个功能目前先给Plus和Pro用户开放网页版,移动端稍后上线。免费用户、企业版和Go Business用户,"未来几周"会陆续获得权限。
对开发者来说,GPT-5.5会通过API以"chat-latest"的形式提供。付费用户如果想继续用老版本5.3,只有三个月的窗口期——之后也会被切掉。
OpenAI今年2月下架GPT-4o时引发过用户强烈反对,很多人把那个模型当成"最好的朋友",甚至有人写请愿书要求保留。这次快速推出新版默认模型,大概也是想减少类似的用户信任危机。
正文完