ChatGPT悄悄换默认模型了:数学正确率从65飙到81,这次AI真的靠谱了?
5月5日,OpenAI正式把ChatGPT的默认模型换成了GPT-5.5 Instant。上线之前,行业里还在讨论AI幻觉问题有多严重——法律、医学、金融这些领域,AI动不动就编造信息。后遗症就是专业人士不敢用,怕出医疗事故或者法律文件出错。
现在GPT-5.5 Instant专门优化了这块。OpenAI说,新模型在法律、医学、金融这些敏感领域的幻觉率明显下降,同时响应速度没变慢。
几个关键数据:
(1) AIME 2025数学测试得分从65.4跳到81.2,提升了24%
(2) 多模态推理基准MMMU-Pro得分从69.2升到76
(3) Plus和Pro用户现在就能用上,新功能支持回溯你的聊天记录、文件和Gmail邮件
第三点有意思。AI现在能翻你的邮件和文件了。之前AI助手只能"看到"当前对话内容,现在能调取历史记录。这对需要处理大量文档的人来说是好事——让AI帮你写报告,它能直接引用你上周的邮件内容。
免费用户还得等几周。OpenAI说后续会开放给Free、Go Business和企业版用户。
另一个更新是记忆溯源功能。ChatGPT以后会显示每条回答的信息来源,你可以删除过时内容或者纠正错误。但有个限制:分享对话时,对方看不到你的记忆来源。
对开发者来说,GPT-5.5会通过API以"chat-latest"的形式提供。旧的5.3版本只保留三个月。
之前OpenAI下架GPT-4o的时候,用户反应很激烈——很多人觉得自己跟那个模型"有感情连接"。这次升级,不知道会不会又有人抗议"我的GPT-5.3没了"。
不过对大多数普通用户来说,AI能不能少胡说八道、响应够不够快,才是真正重要的。至少这次,OpenAI把两个都顾上了。