6月22日,ChatGPT的回复突然变聪明了。
不是什么官方公告,不是什么发布会。只是一批Pro用户在刷X的时候发现:同样一个提示词,输出质量肉眼可见地往上跳了一截。有人以为是自己的错觉,但对比截图出来后,圈子里的人都知道——灰度测试已经开始了。
这不是空穴来风。预测市场Polymarket上,已经有超过96万美元押注GPT-5.6的发布时间窗口。90%的概率,指向6月22日到28日之间。OpenAI内部在做什么,外界猜不准,但市场用真金白银给出了自己的判断。
这次泄露出来的信息相当具体:
(1) 代号kindle-alpha,已经在Pro账号里灰度推送
(2) 上下文窗口从100万Token扩展到150万Token,增幅43%
(3) Agent能力大幅提升,100步以上的工具调用任务可靠性明显增强
(4) 前端和UI生成能力改进显著,开发者在实测中反馈强烈
(5) OpenAI首席科学家Jakub Pachocki在内部邮件中形容这是"相比GPT-5.5有意义的提升"
当然,测试也不是一片叫好。有开发者反映,相同提示词在kindle版本下输出质量不稳定,偶尔还不如早些版本的内测版本。这个"性能回退"的问题目前还不确定是bug还是权宜之计。
为什么这个时候推GPT-5.6?背景不复杂:OpenAI正在筹备IPO,目标是1万亿美元估值。5月份已经向SEC提交了机密文件,高盛和摩根士丹利在背后操盘。GPT-5.6抢在上市前发布,显然是要在资本市场面前展示"技术领先依然稳固"。
但时间窗口并不宽松。Anthropic在5月28日发布了Claude Opus 4.8,支持1000个并行子Agent的工作流编排。中国的MiniMax M3模型在SWE-Bench Pro上已经超越了GPT-5.5。开源的GLM-5.2在FrontierSWE上距离Claude Opus 4.8只差一个身位,但已经明显领先GPT-5.5。
换句话说,OpenAI现在是在三面夹击中冲刺。原地踏步就等于退步,六周一迭代的节奏是被竞争逼出来的。
对普通用户来说,最直接的影响可能是ChatGPT界面即将迎来一次重大改版。OpenAI正在把ChatGPT、Codex和Atlas浏览器整合成一款超级应用,"Intelligence Levels"系统已经替代了旧的模型选择器,分成六个等级。GPT-5.6出来之后,会直接挂在最顶端。
月底发布,概率90%。剩下的10%,大概就是等一个正式公告的时间。
对你来说,这意味着很快你就能用150万Token的上下文窗口处理一整本书、或者一个完整的代码库了。单次对话,上下文窗口内随便翻找,不用再分段,不用再塞记忆。
AI军备竞赛,还在加速。