GPT-5.5把幻觉率砍了一半：ChatGPT默认模型又升级了

数学考试从65分暴涨到81分，幻觉率在法律、医学、金融领域大幅下降。这是OpenAI本周发布的GPT-5.5 Instant交出的成绩单——它已经成为ChatGPT新的默认模型。

5月5日，OpenAI正式推出GPT-5.5 Instant，取代了此前的GPT-5.3 Instant。作为默认模型，所有免费和付费用户都会自动用上新版。

新模型在数学能力上提升明显。AIME 2025数学测试中拿到了81.2分，而上一代只有65.4分。多模态推理 benchmark MMMU-Pro 也从69.2升到76。

但这次升级最实用的改进，是"幻觉率"下降。OpenAI特别提到，在法律、医学、金融这些敏感领域，AI胡编乱造的问题得到了控制——这三个领域最怕的就是一本正经地胡说八道。

另一个实用功能：上下文记忆。现在ChatGPT可以调取你的历史对话、文件和Gmail邮件，给出更精准的个性化回答。比如你上周问过的项目参数，直接接着聊就行，不用重来一遍。这个功能目前先给Plus和Pro用户开放网页版，移动端稍后上线。免费用户、企业版和Go Business用户，"未来几周"会陆续获得权限。

对开发者来说，GPT-5.5会通过API以"chat-latest"的形式提供。付费用户如果想继续用老版本5.3，只有三个月的窗口期——之后也会被切掉。

OpenAI今年2月下架GPT-4o时引发过用户强烈反对，很多人把那个模型当成"最好的朋友"，甚至有人写请愿书要求保留。这次快速推出新版默认模型，大概也是想减少类似的用户信任危机。

GPT-5.5把幻觉率砍了一半：ChatGPT默认模型又升级了

近期文章

近期评论