xAI克隆你的声音只要1分钟:马斯克把AI语音门槛砸到地板了

6次阅读

埃隆·马斯克的xAI又放大招了。

5月2日,xAI正式上线了"Custom Voices"功能——用户只需录制约1分钟的自然语音,就能克隆出自己的声音。整个过程不超过2分钟,克隆声音可以直接接入xAI的语音合成和语音助手API。

这不是玩具。xAI表示,"Custom Voices"已经在Starlink的客服和销售场景中跑起来了。用户打进电话,另一端可能根本不是真人。

有人会问:克隆声音不是很容易被滥用吗?xAI自己也想到了这层。系统采用两步验证:先让用户读一段随机的密语,系统实时比对声纹特征,确认是同一个人。两道关卡卡住,想拿网上录音克隆别人?走不通。

除了自定义声音,xAI还上线了"语音库"——80多种预置音色,涵盖28种语言。不花一分钱,直接调用。

消息一出,开发者社区反应最快。有人开始用它做有声书,有人拿来接入了自己的语音助手产品。比起以前只能选系统预设的机械音色,现在可以换成自己的声音——这对做个人品牌内容的创作者来说,吸引力不小。

马斯克这次把语音克隆的门槛压到了极低。1分钟录音、2分钟生成、不额外收费。这套组合拳打下来,xAI在AI语音这条赛道上正在快速逼近OpenAI和微软。

语音是最直接的交互方式。你接电话时听到的下一句"您好",说不定已经是AI在说话了。

正文完
 0