摘要:AI创业公司Stability AI近日推出全新音频生成模型Stable Audio Open Small,号称是目前速度最快、可于智能手机上本地运行的AI音频生成工具,8秒内即可脱机制作11秒立体声音效,在业界引起广泛关注。
AI创业公司Stability AI近日推出全新音频生成模型Stable Audio Open Small,号称是目前速度最快、可于智能手机上本地运行的AI音频生成工具,8秒内即可脱机制作11秒立体声音效,在业界引起广泛关注。
根据TechCrunch报道,与当前热门的Suno、Udio等云计算音乐AI工具不同,Stable Audio Open Small最大的亮点是:完全不依赖云计算服务器,能直接在手机端进行生成与运算。
此模型专为快速生成节奏类、背景音效设计,适合用于以下应用场景:
节奏鼓点
合成器loop
简易旋律素材
游戏/短影音音效设计
目前生增长度最长为11秒立体声音频,且反应时间仅需8秒以内,非常适合即时原型开发与创作工作流程中使用。
为了让模型真正实现“端侧运行”(即本地处理),Stability AI与芯片大厂Arm合作开发与优化模型架构,让其能顺利在搭载Arm CPU的智慧手机与设备上运行,不必依赖高速网络与云计算计算资源。
与部分竞品(如Udio、Suno)遭质疑使用商业音乐数据训练不同,Stable Audio Open Small仅使用合法授权且免版税的开源数据源,包括:
Free Music Archive(FMA)
Freesound音效数据库
此举也让模型具备更明确的使用安全边界,适合用于教育、创作、商业原型设计等场景。
模型目前仅支持英文提示语
无法生成自然语音或高品质歌声
音乐风格偏西方,对非西方音乐类型(如中式、日式音阶)支持尚不成熟
来源:小殷说科技