ChatGPT最近变聪明了,但你可能不知道,底下的模型已经悄悄换了。
6月第三周,大量开发者和深度用户开始在X上晒对比图——同样的提示词,ChatGPT现在的输出比之前好出一大截。尤其是网页设计、3D渲染和前端代码生成这几个场景,提升肉眼可见。
这不是错觉。多个信息源指向同一个结论:OpenAI正在对GPT-5.6做灰度测试,部分Pro用户已经"被动"用上了。
赌市场上,90%的人押注月底发布
预测市场Polymarket上,已经有超过96万美元押注GPT-5.6的发布时间窗口。截至6月中旬,90%的概率指向6月22日至28日之间发布。
这不是小打小闹。OpenAI首席科学家雅库布·帕奇基(Jakub Pachocki)6月11日在内部消息中告诉员工:GPT-5.6是相比GPT-5.5的"有意义提升"。这是OpenAI高管第一次公开谈到这个模型。
发布节奏也在印证:GPT-5.4今年3月5日上线,GPT-5.5在4月23日跟进,间隔约七周。如果GPT-5.6在6月底发布,保持在六周左右的周期。
代号kindle-alpha,参数泄露
OpenAI最终确定的发布候选版本代号为"kindle-alpha"。
开发者测试显示,GPT-5.6可能包含这些升级:
(1) 上下文窗口从100万Token扩展到150万Token,43%的提升,一口气处理整个代码库或整本书没问题
(2) Agent编程可靠性提升,100步以上的工具调用任务表现更稳
(3) 前端和UI生成能力大幅改善,不需要复杂提示词就能出高质量视觉输出
(4) Token效率比GPT-5.5提升10-15%
(5) 多模态理解改进,图像推理和代码任务结合更好
不过也有杂音:部分测试者反映,同一提示词在kindle版本上输出反而比早期内部版本差,引发外界对正式发布前可能存在性能回退的担忧。
OpenAI冲刺万亿IPO,GPT-5.6是关键棋子
这个时间点不是巧合。OpenAI正在准备可能达到1万亿美元估值的IPO,5月底已向美国证监会秘密递交文件,高盛和摩根士丹利担任顾问。
上市前推出一款强有力的新旗舰模型,对估值故事至关重要。
与此同时,竞争在加剧:Anthropic在5月28日推出Claude Opus 4.8,支持最多1000个并行子Agent的动态工作流。国产AI也在反超:MiniMax的M3模型在SWE-Bench Pro上以59%的得分超越GPT-5.5,中国开源GLM-5.2在FrontierSWE上与Claude Opus 4.8只差一分。
OpenAI不能让外界觉得自己在"吃老本"。
用不用得上,看你付了多少钱
按照OpenAI的历史惯例,GPT-5.6 Pro版本将只向Pro、商业和企业账户开放。Plus用户能用上标准版,免费用户可能会在后续拿到轻量版。
简单说:充了Pro的,已经在用了;没充的,等月底官方公告。
这波灰度测试意味着一件事——GPT-5.6真的近了。