小米发布了一个新的AI编程模型,名叫MiMo-V2.5-Pro。内部测试显示,它用了4.3小时写完了一个完整的编译器项目——这个任务通常需要计算机专业学生好几周。
具体过程是这样的:模型分四个阶段推进,历时4.3小时、672次工具调用,测试覆盖率从59%爬到了100%,最终233个隐藏测试全部通过。第一版编译通过137个测试,中途有一次重构引入了回归bug,模型自己诊断、自己修复了。
这不是唯一一次展示。另一个测试里,模型从几个prompt开始,花了11.5小时写出了一个桌面视频编辑器,约8000行代码,工具调用1870次。还有一个电路模拟器实验:接进去之后,一小时内同时满足全部6个技术指标,其中4个比第一版好了大约10倍。
小米的核心卖点是令牌效率。官方说,MiMo-V2.5-Pro在每任务上平均消耗约7万个tokens,比Claude Opus 4.6和Gemini 3.1 Pro少40%到60%,性能却基本持平。上下文窗口最高支持100万tokens,基础版本不带重训练的版本上限是25.6万tokens。
参数规模上,MiMo-V2.5-Pro总计1.02万亿参数,每次请求活跃420亿。属于混合专家架构——每次只激活部分参数,而不是整个模型一起跑。
这个竞争逻辑很清楚:不是在架构上标新立异,而是在规模和效率上硬碰硬。参数够大、窗口够大、每任务花掉的tokens更少,成本就下来了。
MiMo-V2.5-Pro目前已在小米的mimo.xiaomi.com平台上线。
正文完