谷歌翻译升级:70种语言实时互通,说话人的声音和语气都保留了

5次阅读

谷歌翻译现在能实时翻译70多种语言了,而且说话人的语气、节奏、音调都一并保留下来。

这背后是 Gemini 3.5 Live Translate——谷歌最新一代语音到语音的翻译模型,刚刚在I/O大会上发布。官方说,它只比讲话人慢几秒,就能完成翻译,同时还能模拟说话人的语调。

之前你在国外旅行,想实时翻译,得用谷歌亲儿子Pixel Buds配安卓手机。现在,任何耳机都行,没耳机也行——把手机贴耳朵上,像打电话一样听翻译。谷歌还给这个功能起了个名字,叫" listening mode"。

企业用户这个月就能在 Google Meet 里用上它,Android 和 iOS 的翻译App也会在近期更新。

翻译时保留音色这件事,说起来容易,做起来难。以前的翻译工具听起来像机器人,冷冰冰的。Gemini 3.5 能把原声的情感色彩也一并迁移过去,出来的声音更像人,而不是流水线的合成音。

当然,谷歌没忘了加上保险。所有通过这个功能生成的音频,都强制打上了 SynthID 水印——意思是AI味再轻,也是AI生成的,想抹掉?没门。

70多种语言,覆盖全球大多数主要语种。对需要跨语言沟通的商务人士、旅行者、留学生来说,这个功能比什么耳机都实在。

说到底,语言不该是障碍。

正文完
 0