# 音频生成

Audiox
Audiox是一款利用AI技术生成专业音频的工具,无需音乐知识,可快速创建令人惊叹的音乐和声音效果。
音频生成#音乐制作
780

Elevenlabs Studio
国外精选
ElevenLabs Studio 是一个专注于音频内容创作的平台,利用先进的人工智能技术,能够将文本内容转化为高质量的音频。
文本转声音#音频生成
1,620

Tangoflux
TangoFlux是一个高效的文本到音频(TTA)生成模型,拥有515M参数,能够在单个A40 GPU上仅用3.7秒生成长达30秒的44.1kHz音频。
文本转声音#音频生成开源
672

Sketch2sound
Sketch2Sound是一个生成音频的模型,能够从一组可解释的时间变化控制信号(响度、亮度、音高)以及文本提示中创建高质量的声音。
音频生成#声音模仿
1,176

AI Podcast Generator
AI Podcast Generator是一个在线服务,能够将PDF文件和网页内容快速转换成高质量的音频格式,使用专业的AI语音和可定制的说话风格,以实现完美的内容传递。
文本转声音#音频生成
636

Sound Effect Generator
Sound Effect Generator是一个利用AI技术为用户提供个性化音频创作的平台。
#音频生成
672

Audiolm
AudioLM是由Google Research开发的一个框架,用于高质量音频生成,具有长期一致性。
音频生成#语言模型开源
576

Soundstorm
SoundStorm是由Google Research开发的一种音频生成技术,它通过并行生成音频令牌来大幅减少音频合成的时间。
音频生成#并行处理
1,008

Notebookllama
NotebookLlama是一个开源项目,旨在通过一系列教程和笔记本指导用户构建从PDF到Podcast的工作流。
学习教育#机器学习开源
432

Podcastlm
中文精选
PodCastLM是一个创新的智能播客生成平台,它利用先进的人工智能技术,让用户能够快速生成个性化的音频内容。
音频生成#音频生成
1,044

Pdf2audio
优质新品
PDF2Audio是一个利用OpenAI的GPT模型将PDF文档转换成音频内容的工具。
AI文本转语音#音频生成开源
1,764

Stability AI
Stability AI是一个专注于生成式人工智能技术的公司,提供多种AI模型,包括文本到图像、视频、音频、3D和语言模型。
图片生成#生成式模型
2,052

Bark
优质新品
Bark是由Suno开发的基于Transformer的文本到音频模型,能够生成逼真的多语言语音以及其他类型的音频,如音乐、背景噪声和简单音效。
AI语音合成#多语言开源
696

Stable Audio Open Demo
Stable Audio Open 是一个能够从文本提示生成长达47秒的立体声音频的技术。
AI音乐生成#文本到音频开源
1,680

Genau
GenAU是一个由Snap Research开发的音频生成模型,它通过AutoCap自动字幕生成模型和GenAu音频生成架构,显著提升了音频生成的质量。
AI音频增强器#自动字幕开源
492

Audiolcm
AudioLCM是一个基于PyTorch实现的文本到音频生成模型,它通过潜在一致性模型来生成高质量且高效的音频。
AI文本转语音#语音合成开源
2,028

Stable Audio Open
国外精选
Stable Audio Open是一个开源的文本到音频模型,专为生成短音频样本、音效和制作元素而优化。
AI音乐生成#开源模型
1,404

Localai
LocalAI 是一个自托管的开源 OpenAI 替代品,可在消费级硬件上运行,支持本地或本地部署的文本、音频、图像生成。
AI模型#自托管开源
1,260

Wookeys AI
Ultimate AI Assistant是一款综合AI助手,可帮助您简化任务,提高工作效率。
个人助理#文本生成
4,884

Optimizerai
OptimizerAI专注于使用人工智能技术生成各种声音效果,旨在为游戏、视频、短片、广告等多媒体内容增添活力。
音频生成#AI声音效果
6,300

Stable Audio Tools
stable-audio-tools是一个开源的PyTorch库,提供了用于条件音频生成的生成模型的训练和推理代码。
AI音乐生成#PyTorch开源
1,872

Gotalk.ai
Gotalk.ai 是一个强大的 AI 语音生成器,能够在几分钟内创建逼真的语音。
语音生成#语音合成
4,248

Openai TTS
OpenAI TTS提供文本到语音的API,基于他们的TTS模型。
AI文本转语音#音频生成
37.74k

Shortvideogen
ShortVideoGen是一个简单易用的文本转视频应用,使用最先进的视频和音频生成AI模型,帮助您在几秒钟内创建个性化视频。
视频生成#短视频
7,248

Wois
Wois 是一款人工智能工具,生成真实的音频视频内容,并将您与全球专业人士和专家连接起来。
视频生成#在线影响力
336

Promp
AI创意市场是一个AI创意产品的在线市场,用户可以轻松买卖AI动力激发的创意,从文本生成开始,未来还会引入图像、视频和音频生成等更多功能。
AI模型#创意市场
312

Audiocraft
AudioCraft 是一个用于音频处理和生成的 PyTorch 库。
AI音乐生成#音频生成开源
960
精选AI产品推荐

Nocode
中文精选
NoCode 是一款无需编程经验的平台,允许用户通过自然语言描述创意并快速生成应用,旨在降低开发门槛,让更多人能实现他们的创意。
开发平台#应用开发
912

Listenhub
优质新品
ListenHub 是一款轻量级的 AI 播客生成工具,支持中文和英语,基于前沿 AI 技术,能够快速生成用户感兴趣的播客内容。
音频生成#AI
348

Lovart
国外精选
Lovart 是一款革命性的 AI 设计代理,能够将创意提示转化为艺术作品,支持从故事板到品牌视觉的多种设计需求。
AI设计工具#创意工具
1,128

Fastvlm
FastVLM 是一种高效的视觉编码模型,专为视觉语言模型设计。
AI模型#图像处理开源
564

Smart PDFs
国外精选
Smart PDFs 是一个在线工具,利用 AI 技术快速分析 PDF 文档,并生成简明扼要的总结。
文章摘要#AI
984

Keysync
KeySync 是一个针对高分辨率视频的无泄漏唇同步框架。
视频编辑#视频处理开源
480

Anyvoice
AnyVoice是一款领先的AI声音生成器,采用先进的深度学习模型,将文本转换为与人类无法区分的自然语音。
音频生成#文本转语音
26.38k

Liblibai
中文精选
LiblibAI是一个中国领先的AI创作平台,提供强大的AI创作能力,帮助创作者实现创意。
AI模型#图像生成
344.42k