xAI推出语音克隆功能:1分钟录音,就能克隆你的声音

7次阅读

格罗克(Grok)的开发者xAI最近上线了一个新功能,叫"Custom Voices"。普通人花1分钟读几句话,就能把自己的声音克隆出来,而且这个克隆声音可以直接用在xAI的语音合成和语音代理API里。

具体怎么操作的?你登录xAI控制台,读一段指定的密码文字,系统同时验证两个录音的特征,确认是同一个人在说话,然后就能生成专属语音模型了。整个过程不到2分钟。

官方说这个设计是为了防止有人拿别人的录音去克隆声音——换句话说,你想克隆明星、克隆朋友?这条路被堵死了。

除了自定义语音,xAI还同步上线了一个"语音库",内置80多种预设声音,支持28种语言。不额外收费。

这个功能背后是xAI近期发布的一系列语音接口:格罗克语音转文字、语音转文字+文字转语音的双向API,以及"Grok Voice Think Fast 1.0"语音代理模型。官方透露,星链(Starlink)的客服和销售系统已经开始用这套技术了。

语音克隆不是什么新概念,但门槛从来没这么低过。以前要花几千块、录几十分钟,现在1分钟、零成本。问题是:当任何人都能完美复制你的声音,诈骗、谣言的门坎也跟着降到了零。

正文完
 0