Stable Audio Open 1.0
Stable Audio Open 1.0
该产品适合音乐制作人、音频工程师、研究人员以及任何对AI音乐生成感兴趣的个人或团队。它为艺术家提供了一个实验和创造新音乐作品的工具,同时为研究人员提供了探索和改进生成性AI模型的平台。
总访问量: 29,742,941
占比最多地区: US(17.94%)
1,836
简介
Stable Audio Open 1.0是一个利用自编码器、基于T5的文本嵌入和基于变压器的扩散模型来生成长达47秒的立体声音频的AI模型。它通过文本提示生成音乐和音频,支持研究和实验,以探索生成性AI模型的当前能力。该模型在Freesound和Free Music Archive (FMA)的数据集上进行训练,确保了数据的多样性和版权合法性。
截图
产品特色
生成长达47秒的立体声音频。
支持44.1kHz的音频采样率。
基于文本提示的音乐和音频生成。
使用自编码器压缩波形到可管理的序列长度。
基于T5的文本嵌入技术进行文本条件处理。
扩散模型在自编码器的潜在空间中操作。
使用教程
下载并安装所需的stable-audio-tools库。
使用提供的代码示例下载预训练模型。
设置文本和时间条件,定义音频的起始时间和总长度。
调用模型生成扩散条件音频。
对生成的音频进行重排、峰值归一化、剪辑、转换为int16格式,并保存为文件。
流量来源
直接访问48.39%外链引荐35.85%邮件0.03%
自然搜索12.76%社交媒体2.96%展示广告0.02%
最新流量情况
月访问量
25296.55k
平均访问时长
285.77
每次访问页数
5.83
跳出率
43.31%
总流量趋势图
地理流量分布情况
美国
17.94%
中国
17.08%
印度
8.40%
俄罗斯
4.58%
日本
3.42%
地理流量分布全球图