Stability AI推出用于音频生成的开源AI模型Stable Audio Open_陀螺科技

我要发布

Stability AI推出用于音频生成的开源AI模型Stable Audio Open

前方智能原创 2024-06-06 11:06 热度 2822

分享

微信扫一扫：分享

微信里点“发现”，扫一下
二维码便可将本文分享至朋友圈

IP归属：广东

文章AI导读

一键萃取文章精髓，核心观点即刻呈现

# 梳理该事件的完整脉络

# 该文章有哪些有意思的观点或数据

# 大家对该事件的态度表现如何？

AI初创公司Stability AI近日发布了Stable Audio Open 1.0，以进一步扩大其在音频市场的影响力。

图源：Stability AI

据悉，Stable Audio Open 1.0是此前推出的商业Stable Audio产品的开源版本。2023年9月，Stability AI首次公开推出Stable Audio，产品定位为一款文本到音频的AI生成工具，而后又于今年4月3日发布Stable Audio 2.0，在生成的音频清晰度和长度上都实现了突破。

与Stable Audio不同的是，Stable Audio Open是一个开源版本，专注于创建鼓节拍，乐器即兴重复，环境声音和其他用于音乐制作和声音设计的音频样本，可根据提供的文本提示生成长达47秒的样本、音效和制作元素。

值得注意的是，Stable Audio Open无法生成逼真的人声，其目的不是创建完整的歌曲，而是将重点放在在较短的音频片段上，同时，由于模型在英文文本描述上进行训练，因此在其他语言中的表现不佳，由于训练数据集的偏差，模型也无法为所有音乐风格提供相同质量的输出。

人工智能大模型生成式AI 音频生成

陀螺科技现已开放专栏入驻，详情请见入驻指南： https://www.tuoluo.cn/article/detail-27547.html

前方智能专栏： https://www.tuoluo.cn/columns/author1911845/

本文网址： https://www.tuoluo.cn/article/detail-10113036.html

免责声明：
1、本文版权归原作者所有，仅代表作者本人观点，不代表陀螺科技观点或立场。
2、如发现文章、图片等侵权行为，侵权责任将由作者本人承担。

上一篇：存在火灾隐患，Humane 要求用户停止使用 AI Pin 充电盒

下一篇：面壁智能宣布MiniCPM模型将免费商用

相关文章

强化学习之父萨顿：静态数据已接近极限，AI进入经验时代

Meshy完成近4亿美元B轮融资，推动3D AI模型研发...

DAA从理念走向标准，百度迎来智能经济时代蝶变

芯报丨我国规上工业企业人工智能应用普及率已超30%

TRAE Work Design模式深度测评：AI设计终...

AI进入下半场：模型不再稀缺，真正稀缺的是算力、场景和信...