xAI突然开放声音克隆:录1分钟,做一个你的"分身"

4次阅读

录1分钟声音,就能做一个你的"分身"。

xAI刚刚上线了一个叫Custom Voices的新功能,直接把门槛砍到了地板:你在控制台说不到1分钟的自然语言,系统不到2分钟就给你训练好一个声音模型。

这个克隆声音可以干嘛?直接接进xAI的语音合成和语音代理API里。说人话就是——你可以用你自己的声音,让AI替你打电话、做客服、当助手。

怎么防止拿别人声音乱搞?

xAI搞了个两步验证:先让你读一段随机口令,系统实时比对;然后再把你的原始录音和克隆声音做声纹对比,确认是同一个人。两道关卡下来,想拿网上随便找的音频克隆,基本没戏。

不想自己录?平台还内置了80多个预制声音,覆盖28种语言,不想动嘴的直接用现成的就行。克隆声音不额外收费。

这个功能是xAI近期语音能力的一次整合——接上了Grok的语音转文字、语音合成API,还有"Think Fast 1.0"语音代理模型。这套组合已经在Starlink的客服和销售场景跑起来了。

声音克隆这件事,以前只有专业配音员或者大公司才能玩。现在成本低到普通用户也能做。问题是:你会拿它来干嘛?

正文完
 0