Resemble
Resemble AI可用于多种场景,包括呼叫中心、智能助手、广告、娱乐、有声书等。
总访问量: 444,885
占比最多地区: US(12.75%)
49.14k
简介
Resemble AI是一款AI语音生成器,可以在几秒钟内创建逼真的人声。它还支持语音克隆,可以录制或上传语音数据来生成自己的AI声音。Resemble AI还提供实时语音到语音和文本到语音转换功能,可用于创建自定义声音。此外,Resemble AI还提供语音编辑和语言本地化功能,可帮助用户轻松编辑和本地化语音内容。Resemble AI还提供API和移动端支持,可以在Android和iOS上原生运行。定价和商业定位请参考官方网站。
截图
产品特色
语音克隆
文本到语音转换
语音到语音转换
语音编辑
语言本地化
API支持
移动端支持
流量来源
直接访问30.46%外链引荐59.28%邮件0.09%
自然搜索7.17%社交媒体2.49%展示广告0.51%
最新流量情况
月访问量
635.07k
平均访问时长
104.87
每次访问页数
4.47
跳出率
41.95%
总流量趋势图
地理流量分布情况
美国
12.75%
印度
7.04%
孟加拉国
6.26%
巴基斯坦
5.08%
巴西
2.86%
地理流量分布全球图
同类开源产品
Parakeet Tdt 0.6b V2
parakeet-tdt-0.6b-v2 是一个 600 百万参数的自动语音识别(ASR)模型,旨在实现高质量的英语转录,具有准确的时间戳预测和自动标点符号、大小写支持。
语音识别#深度学习
Kimi Audio
Kimi-Audio 是一个先进的开源音频基础模型,旨在处理多种音频处理任务,如语音识别和音频对话。
语音识别#音频处理
Amazon Nova Sonic
Amazon Nova Sonic 是一款前沿的基础模型,能够整合语音理解和生成,提升人机对话的自然流畅度。
语音识别#人工智能
CSM 1B
CSM 1B 是一个基于 Llama 架构的语音生成模型,能够从文本和音频输入中生成 RVQ 音频代码。
语音生成#文本到语音
Durt
DuRT 是一款专注于 macOS 系统的语音识别和翻译工具。
语音识别#翻译
Elevenlabs Scribe
Scribe 是由 ElevenLabs 开发的高精度语音转文字模型,旨在处理真实世界音频的不可预测性。
语音识别#多语言
Step Audio
Step-Audio是首个生产级开源智能语音交互框架,整合了语音理解与生成能力,支持多语言对话、情感语调、方言、语速和韵律风格控制。
语音识别#多语言
Fireredasr AED L
FireRedASR-AED-L 是一个开源的工业级自动语音识别模型,专为满足高效率和高性能的语音识别需求而设计。
语音识别#开源
Fireredasr
FireRedASR 是一个开源的工业级普通话自动语音识别模型,采用 Encoder-Decoder 和 LLM 集成架构。
语音识别#人工智能
替代品
Parakeet Tdt 0.6b V2
parakeet-tdt-0.6b-v2 是一个 600 百万参数的自动语音识别(ASR)模型,旨在实现高质量的英语转录,具有准确的时间戳预测和自动标点符号、大小写支持。
语音识别#深度学习
Kimi Audio
Kimi-Audio 是一个先进的开源音频基础模型,旨在处理多种音频处理任务,如语音识别和音频对话。
语音识别#音频处理
CSM 1B
CSM 1B 是一个基于 Llama 架构的语音生成模型,能够从文本和音频输入中生成 RVQ 音频代码。
语音生成#文本到语音
Step Audio
Step-Audio是首个生产级开源智能语音交互框架,整合了语音理解与生成能力,支持多语言对话、情感语调、方言、语速和韵律风格控制。
语音识别#多语言
Fireredasr AED L
FireRedASR-AED-L 是一个开源的工业级自动语音识别模型,专为满足高效率和高性能的语音识别需求而设计。
语音识别#开源
Fireredasr
FireRedASR 是一个开源的工业级普通话自动语音识别模型,采用 Encoder-Decoder 和 LLM 集成架构。
语音识别#人工智能
Pengchengstarling
PengChengStarling 是一个专注于多语言自动语音识别(ASR)的开源工具包,基于 icefall 项目开发。
语音识别#自动语音识别
Realtimestt
RealtimeSTT是一个开源的语音识别模型,能够实时将语音转换为文本。
语音识别#实时转录
Minmo
MinMo是阿里巴巴集团通义实验室开发的一款多模态大型语言模型,拥有约80亿参数,专注于实现无缝语音交互。
语音识别#多模态