41天,连发两版。这就是Anthropic的速度。
5月28日,Anthropic正式发布Opus 4.8,距离上一个版本Opus 4.7才过去41天。这个节奏对于AI圈来说异常快——Haiku模型上次更新是7个月前,Sonnet也是3个月前。
为什么这么快?一个可能的答案:4.7卖得不好。
有用户直接评价4.7「令人失望」。同期,OpenAI的Codex和谷歌的Gemini Flash都在狂更新,Anthropic压力山大。
Opus 4.8最大的改进不是性能数字,而是态度。
官方说:新模型「更倾向于主动标出自己的不确定区域,而不是硬编答案」。桥水基金(Bridgewater)测试后印证了这一点: Opus 4.8会主动提示输入和输出中的问题,而其他模型通常直接略过,等着用户自己发现。
翻译成人话就是:你问它不知道的事,它不再瞎编了,会老实说「我不确定」。
配合新模型,Anthropic还推出了一个叫「动态工作流」(Dynamic Workflows)的功能,目前是研究预览阶段。官方描述:用Opus 4.8驱动Claude Code,能自动完成几十万行代码库的迁移,从启动到合并,全程自动。
另外,被曝光的顶级模型Mythos还在憋着——上个月预览时引发网络安全担忧,Anthropic说还得再等等,「几周内」会出来。
几个关键数据:
(1) 41天——两版间隔,创Anthropic纪录
(2) 标准定价不变——没涨价,也没降价
(3) 几百个并行子代理——Dynamic Workflows支持同时跑
这波更新说明一件事:Anthropic不想再只拼参数了,开始拼「可靠性」这张牌。当模型越来越强,能不能老实承认自己不知道,比能不能答对更难。Opus 4.8选择先解决这个。
对你来说,如果你正在用AI干活,最怕的不是它答错,而是它答得听起来很对、其实在瞎编。现在至少多了一层保险。