腾讯440MB开源翻译模型:33语言离线跑,30个国际比赛第一,Google翻译危险了

7次阅读

腾讯出了一个你该知道的翻译工具。

一款只有440MB的AI模型,33种语言,离线运行,翻译质量媲美Google翻译——而且不需要联网,不需要注册账号,不需要付钱。

这就是腾讯混元团队最新开源的 Hy-MT1.5-1.8B-1.25bit 模型。上周末发布在 Hugging Face,已经有人在讨论它是否会让Google翻译过时。

关键数字就几个:

(1) 440MB,压缩后体积。原始大小是3.3GB,腾讯用了一种叫1.25bit的参数压缩技术,把模型"瘦身"到原来的七分之一,翻译质量没有下降。

(2) 33种语言,覆盖德、英、中、日、法、藏、蒙,还有5种方言,总共1056个翻译方向。

(3) 在标准翻译基准测试FLORES-200上,分数和那些体积大几百倍的商用模型基本持平。

(4) 腾讯说这款模型已经在国际机器翻译比赛里拿了30个第一。

为什么这值得关注?

传统翻译工具,不管是Google翻译还是DeepL,都需要把数据上传到服务器处理。隐私问题一直有人在讨论,但没得选。腾讯这个模型直接跑在手机上,所有内容都在本地处理,流量不进服务器。

腾讯还放出了一个Android演示APP,直接在任意APP里取词翻译,全程离线。开源的意思是你可以在自己服务器上部署,不依赖任何人。

技术方向上,这和Google最近在推的Gemma 4一致——把大模型压缩到手机能跑的体积,让AI真正变成一个本地工具,而不是云端服务。

当然,440MB对iPhone用户来说还是个门槛,APP Store目前没有。不过开源社区动手能力很强,移植只是时间问题。

翻译这个赛道,Google当了十几年老大。腾讯用一种"小模型+强压缩"的思路撕开了一道口子。能不能撼动市场还不知道,但至少说明一件事:AI翻译这场仗,还没打完。

正文完
 0