90%概率月底发布：GPT-5.6灰度测试曝光，150万Token上下文

6月22日，ChatGPT的回复突然变聪明了。

不是什么官方公告，不是什么发布会。只是一批Pro用户在刷X的时候发现：同样一个提示词，输出质量肉眼可见地往上跳了一截。有人以为是自己的错觉，但对比截图出来后，圈子里的人都知道——灰度测试已经开始了。

这不是空穴来风。预测市场Polymarket上，已经有超过96万美元押注GPT-5.6的发布时间窗口。90%的概率，指向6月22日到28日之间。OpenAI内部在做什么，外界猜不准，但市场用真金白银给出了自己的判断。

这次泄露出来的信息相当具体：

(1) 代号kindle-alpha，已经在Pro账号里灰度推送
(2) 上下文窗口从100万Token扩展到150万Token，增幅43%
(3) Agent能力大幅提升，100步以上的工具调用任务可靠性明显增强
(4) 前端和UI生成能力改进显著，开发者在实测中反馈强烈
(5) OpenAI首席科学家Jakub Pachocki在内部邮件中形容这是"相比GPT-5.5有意义的提升"

当然，测试也不是一片叫好。有开发者反映，相同提示词在kindle版本下输出质量不稳定，偶尔还不如早些版本的内测版本。这个"性能回退"的问题目前还不确定是bug还是权宜之计。

为什么这个时候推GPT-5.6？背景不复杂：OpenAI正在筹备IPO，目标是1万亿美元估值。5月份已经向SEC提交了机密文件，高盛和摩根士丹利在背后操盘。GPT-5.6抢在上市前发布，显然是要在资本市场面前展示"技术领先依然稳固"。

但时间窗口并不宽松。Anthropic在5月28日发布了Claude Opus 4.8，支持1000个并行子Agent的工作流编排。中国的MiniMax M3模型在SWE-Bench Pro上已经超越了GPT-5.5。开源的GLM-5.2在FrontierSWE上距离Claude Opus 4.8只差一个身位，但已经明显领先GPT-5.5。

换句话说，OpenAI现在是在三面夹击中冲刺。原地踏步就等于退步，六周一迭代的节奏是被竞争逼出来的。

对普通用户来说，最直接的影响可能是ChatGPT界面即将迎来一次重大改版。OpenAI正在把ChatGPT、Codex和Atlas浏览器整合成一款超级应用，"Intelligence Levels"系统已经替代了旧的模型选择器，分成六个等级。GPT-5.6出来之后，会直接挂在最顶端。

月底发布，概率90%。剩下的10%，大概就是等一个正式公告的时间。

对你来说，这意味着很快你就能用150万Token的上下文窗口处理一整本书、或者一个完整的代码库了。单次对话，上下文窗口内随便翻找，不用再分段，不用再塞记忆。

90%概率月底发布：GPT-5.6灰度测试曝光，150万Token上下文

近期文章

近期评论