全球最快端侧音频生成模型登场!Stable Audio Open Small手机8秒内生出11秒立体声音效

360影视 欧美动漫 2025-05-17 15:32 2

摘要:AI创业公司Stability AI近日推出全新音频生成模型Stable Audio Open Small,号称是目前速度最快、可于智能手机上本地运行的AI音频生成工具,8秒内即可脱机制作11秒立体声音效,在业界引起广泛关注。

AI创业公司Stability AI近日推出全新音频生成模型Stable Audio Open Small,号称是目前速度最快、可于智能手机上本地运行的AI音频生成工具,8秒内即可脱机制作11秒立体声音效,在业界引起广泛关注。

根据TechCrunch报道,与当前热门的Suno、Udio等云计算音乐AI工具不同,Stable Audio Open Small最大的亮点是:完全不依赖云计算服务器,能直接在手机端进行生成与运算。

此模型专为快速生成节奏类、背景音效设计,适合用于以下应用场景:

节奏鼓点

合成器loop

简易旋律素材

游戏/短影音音效设计

目前生增长度最长为11秒立体声音频,且反应时间仅需8秒以内,非常适合即时原型开发与创作工作流程中使用。

为了让模型真正实现“端侧运行”(即本地处理),Stability AI与芯片大厂Arm合作开发与优化模型架构,让其能顺利在搭载Arm CPU的智慧手机与设备上运行,不必依赖高速网络与云计算计算资源。

与部分竞品(如Udio、Suno)遭质疑使用商业音乐数据训练不同,Stable Audio Open Small仅使用合法授权且免版税的开源数据源,包括:

Free Music Archive(FMA)

Freesound音效数据库

此举也让模型具备更明确的使用安全边界,适合用于教育、创作、商业原型设计等场景。

模型目前仅支持英文提示语

无法生成自然语音或高品质歌声

音乐风格偏西方,对非西方音乐类型(如中式、日式音阶)支持尚不成熟

来源:小殷说科技

相关推荐