Token用量少60%：小米AI编程模型4.3小时写完一个编译器

小米发布了一个新的AI编程模型，名叫MiMo-V2.5-Pro。内部测试显示，它用了4.3小时写完了一个完整的编译器项目——这个任务通常需要计算机专业学生好几周。

具体过程是这样的：模型分四个阶段推进，历时4.3小时、672次工具调用，测试覆盖率从59%爬到了100%，最终233个隐藏测试全部通过。第一版编译通过137个测试，中途有一次重构引入了回归bug，模型自己诊断、自己修复了。

这不是唯一一次展示。另一个测试里，模型从几个prompt开始，花了11.5小时写出了一个桌面视频编辑器，约8000行代码，工具调用1870次。还有一个电路模拟器实验：接进去之后，一小时内同时满足全部6个技术指标，其中4个比第一版好了大约10倍。

小米的核心卖点是令牌效率。官方说，MiMo-V2.5-Pro在每任务上平均消耗约7万个tokens，比Claude Opus 4.6和Gemini 3.1 Pro少40%到60%，性能却基本持平。上下文窗口最高支持100万tokens，基础版本不带重训练的版本上限是25.6万tokens。

参数规模上，MiMo-V2.5-Pro总计1.02万亿参数，每次请求活跃420亿。属于混合专家架构——每次只激活部分参数，而不是整个模型一起跑。

这个竞争逻辑很清楚：不是在架构上标新立异，而是在规模和效率上硬碰硬。参数够大、窗口够大、每任务花掉的tokens更少，成本就下来了。

MiMo-V2.5-Pro目前已在小米的mimo.xiaomi.com平台上线。

近期文章