6分钟的专业级音乐：Stability AI 发布 Stable Audio 3.0，AI音乐生成进入新时代

Stability AI 刚刚发布了一套新的音频模型，叫 Stable Audio 3.0。最强的那个版本，能生成超过6分钟的专业级音乐。

这家靠稳定扩散出名的公司，一口气发布了四个版本：

(1) Small SFX：4.59亿参数，适合设备端音效生成，最多2分钟
(2) Small：同样4.59亿参数，设备端音乐生成，最多2分钟
(3) Medium：14亿参数，可生成6分20秒的完整作曲
(4) Large：27亿参数，仅通过API和自托管付费服务提供

上一个版本 Stable Audio 2.0 是2024年发布的，最多只能生成约3分钟的音乐。新版本直接翻倍，而且能保持曲式结构和旋律连贯性。

关键区别：小号和中号模型完全开源，任何人都可以下载、使用和修改。大号模型则需要企业授权——如果你公司年收入超过100万美元，就必须买企业许可。

音乐版权问题一直AI音乐公司的命门。Suno 和 Udio 正在和各大唱片公司打官司，因为被指控非法抓取音乐训练AI。Stability AI 吸取了教训，去年就搞定了华纳音乐集团和环球音乐集团的合作，数据全部来自正规授权。

人才争夺战也在升温。Stability AI 挖来了前环球音频和 Fender 的首席数字官 Ethan Kaplan 来主导专业音乐产品线。Suno 则请来了前 Merlin CEO 担任首席商务官。

AI音乐生成正在从"玩具"变成"工具"。大厂纷纷入局：Google 有 Lyria 3 Pro，ElevenLabs 也在做。但谁能解决版权问题，谁就能活到最后。

近期文章