xAI推出语音克隆功能:1分钟录音,就能克隆你的声音

5次阅读

埃隆·马斯克旗下xAI发布了一项新功能——Custom Voices。普通用户只需录制约1分钟的自然语音,就能获得一个属于自己的声音克隆模型。整个过程不超过2分钟。

这个功能上周上线xAI控制台,已向开发者开放。通过这套系统,你可以把克隆声音接入xAI的语音合成和语音助手API。

怎么实现的?

用户第一遍需要朗读一段随机生成的密语,系统实时校验;第二遍再说同样内容,两次录音比对声纹特征,确认是同一人。xAI官方称,这套机制让克隆他人声音变得不可能。

除了自定义声音,xAI还同步推出了"语音库",内置超过80种预设音色,覆盖28种语言,使用克隆声音不额外收费。

这不是语音合成技术的第一次突破,但把门槛压到"1分钟录音+2分钟等待",让普通用户触手可及。

背后依托的是xAI此前发布的Grok语音转文字、文字转语音API,以及Grok Voice Think Fast 1.0语音助手模型。xAI透露,这套技术已经在Starlink的客服和销售场景落地。

现在的问题是:当任何人都能低成本克隆自己的声音,那些"听见为实"的场景还可靠吗?

正文完
 0