GPT-5.6要来了?ChatGPT已被曝偷偷测试,6月22日见分晓

6次阅读

消息传了快一个月,现在越来越像真的了。

多家外媒报道,OpenAI下一代旗舰模型GPT-5.6已经悄悄开始在ChatGPT后台小范围测试。部分Pro订阅用户发现,最近ChatGPT的响应质量明显提升,尤其是代码生成和UI设计方面——但他们选的还是GPT-5.5。

这不是用户错觉。预测市场Polymarket数据显示,交易员们在GPT-5.6发布窗口上押了超过96万美元,90%的赔率指向6月22日至28日这个时间段。OpenAI首席科学家Jakub Pachocki也被曝曾在内部邮件中称该模型是"对比GPT-5.5有意义的提升"。

如果消息属实,GPT-5.6可能会是这样的:

  • 上下文窗口从100万Token提升到150万Token,理论上能一口气读完一整本书或者处理完一个大型代码库
  • 编程代理能力加强,100步以上的工具调用任务稳定性提升
  • 前端和UI生成效果改善,开发者的直观反馈是"不需要复杂提示词就能出好活"
  • Token效率比GPT-5.5提升10%到15%

发布节奏也符合OpenAI近期的习惯:GPT-5.4三月发布,GPT-5.5四月跟进,间隔六周左右。GPT-5.6如果月内面世,维持同一节奏。

但压力不只是来自内部。

Anthropic在5月28日推出了Claude Opus 4.8,支持最多1000个并行子代理的工作流编排。国内的MiniMax M3也在SWE-Bench Pro上跑出了59%的成绩,超越了GPT-5.5。开源阵营GLM-5.2和Claude Opus 4.8的差距只剩一分。

更宏观的背景是:OpenAI据报正在筹备估值可能达到1万亿美元的IPO,承销商是和高盛、摩根士丹利。GPT-5.6的表现,将直接影响资本市场对它的定价逻辑。

说白了,这不只是技术发布,是上市前最关键的一次亮相。

对普通用户而言,GPT-5.6最值得期待的还是实际体验。上下文窗口翻倍意味着你可以丢给它一整本技术文档让它消化;编程能力提升意味着它处理复杂项目的可靠性会再上一个台阶。如果你用ChatGPT写过代码或者处理过长文档,这些改进是能感知到的。

现在的问题是:要不要续订Pro等一波?

正文完
 0