Stability AI 刚刚发布了一套新的音频模型,叫 Stable Audio 3.0。最强的那个版本,能生成超过6分钟的专业级音乐。
这家靠稳定扩散出名的公司,一口气发布了四个版本:
(1) Small SFX:4.59亿参数,适合设备端音效生成,最多2分钟
(2) Small:同样4.59亿参数,设备端音乐生成,最多2分钟
(3) Medium:14亿参数,可生成6分20秒的完整作曲
(4) Large:27亿参数,仅通过API和自托管付费服务提供
上一个版本 Stable Audio 2.0 是2024年发布的,最多只能生成约3分钟的音乐。新版本直接翻倍,而且能保持曲式结构和旋律连贯性。
关键区别:小号和中号模型完全开源,任何人都可以下载、使用和修改。大号模型则需要企业授权——如果你公司年收入超过100万美元,就必须买企业许可。
音乐版权问题一直AI音乐公司的命门。Suno 和 Udio 正在和各大唱片公司打官司,因为被指控非法抓取音乐训练AI。Stability AI 吸取了教训,去年就搞定了华纳音乐集团和环球音乐集团的合作,数据全部来自正规授权。
人才争夺战也在升温。Stability AI 挖来了前环球音频和 Fender 的首席数字官 Ethan Kaplan 来主导专业音乐产品线。Suno 则请来了前 Merlin CEO 担任首席商务官。
AI音乐生成正在从"玩具"变成"工具"。大厂纷纷入局:Google 有 Lyria 3 Pro,ElevenLabs 也在做。但谁能解决版权问题,谁就能活到最后。
正文完