全球最快端侧音频生成模型登场！Stable Audio Open Small手机8秒内生出11秒立体声音效

摘要：AI创业公司Stability AI近日推出全新音频生成模型Stable Audio Open Small，号称是目前速度最快、可于智能手机上本地运行的AI音频生成工具，8秒内即可脱机制作11秒立体声音效，在业界引起广泛关注。

AI创业公司Stability AI近日推出全新音频生成模型Stable Audio Open Small，号称是目前速度最快、可于智能手机上本地运行的AI音频生成工具，8秒内即可脱机制作11秒立体声音效，在业界引起广泛关注。

根据TechCrunch报道，与当前热门的Suno、Udio等云计算音乐AI工具不同，Stable Audio Open Small最大的亮点是：完全不依赖云计算服务器，能直接在手机端进行生成与运算。

此模型专为快速生成节奏类、背景音效设计，适合用于以下应用场景：

节奏鼓点

合成器loop

简易旋律素材

游戏/短影音音效设计

目前生增长度最长为11秒立体声音频，且反应时间仅需8秒以内，非常适合即时原型开发与创作工作流程中使用。

为了让模型真正实现“端侧运行”（即本地处理），Stability AI与芯片大厂Arm合作开发与优化模型架构，让其能顺利在搭载Arm CPU的智慧手机与设备上运行，不必依赖高速网络与云计算计算资源。

与部分竞品（如Udio、Suno）遭质疑使用商业音乐数据训练不同，Stable Audio Open Small仅使用合法授权且免版税的开源数据源，包括：

Free Music Archive（FMA）

Freesound音效数据库

此举也让模型具备更明确的使用安全边界，适合用于教育、创作、商业原型设计等场景。

模型目前仅支持英文提示语

无法生成自然语音或高品质歌声

音乐风格偏西方，对非西方音乐类型（如中式、日式音阶）支持尚不成熟

来源：小殷说科技

标签： audio stable audioopen stablea

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!