总访问量: 6,784
1,212
简介
ABox是一款多功能的语音变声应用,可帮助用户保护隐私,恢复声带损伤,使性别多样化的个体自由表达。无论您的需求是什么,ABox都能提供声音自由的解决方案。
截图
产品特色
实时语音变声
随时切换声音
便捷易用
保护隐私
流量来源
直接访问0.00%外链引荐0.00%邮件0.00%
自然搜索0.00%社交媒体0.00%展示广告0.00%
最新流量情况
月访问量
58.54k
平均访问时长
9.91
每次访问页数
1.47
跳出率
55.03%
总流量趋势图
同类开源产品
Parakeet Tdt 0.6b V2
parakeet-tdt-0.6b-v2 是一个 600 百万参数的自动语音识别(ASR)模型,旨在实现高质量的英语转录,具有准确的时间戳预测和自动标点符号、大小写支持。
语音识别#深度学习
Clonegen
CloneGen是一款利用先进的人工智能技术实现声音克隆和文字转语音的应用。
语音克隆#人工智能
Kimi Audio
Kimi-Audio 是一个先进的开源音频基础模型,旨在处理多种音频处理任务,如语音识别和音频对话。
语音识别#音频处理
Weclone
WeClone 是一个基于微信聊天记录微调大语言模型的项目,主要用于实现高质量的声音克隆和数字分身。
语音克隆#声音克隆
Amazon Nova Sonic
Amazon Nova Sonic 是一款前沿的基础模型,能够整合语音理解和生成,提升人机对话的自然流畅度。
语音识别#人工智能
Megatts 3
MegaTTS 3 是由字节跳动开发的一款基于 PyTorch 的高效语音合成模型,具有超高质量的语音克隆能力。
语音克隆#深度学习
Sesame AI
Sesame AI 代表了下一代语音合成技术,通过结合先进的人工智能技术和自然语言处理,能够生成极其逼真的语音,具备真实的情感表达和自然的对话流程。
语音克隆#人工智能
Durt
DuRT 是一款专注于 macOS 系统的语音识别和翻译工具。
语音识别#翻译
Elevenlabs Scribe
Scribe 是由 ElevenLabs 开发的高精度语音转文字模型,旨在处理真实世界音频的不可预测性。
语音识别#多语言
替代品
Parakeet Tdt 0.6b V2
parakeet-tdt-0.6b-v2 是一个 600 百万参数的自动语音识别(ASR)模型,旨在实现高质量的英语转录,具有准确的时间戳预测和自动标点符号、大小写支持。
语音识别#深度学习
Kimi Audio
Kimi-Audio 是一个先进的开源音频基础模型,旨在处理多种音频处理任务,如语音识别和音频对话。
语音识别#音频处理
Weclone
WeClone 是一个基于微信聊天记录微调大语言模型的项目,主要用于实现高质量的声音克隆和数字分身。
语音克隆#声音克隆
Megatts 3
MegaTTS 3 是由字节跳动开发的一款基于 PyTorch 的高效语音合成模型,具有超高质量的语音克隆能力。
语音克隆#深度学习
Step Audio
Step-Audio是首个生产级开源智能语音交互框架,整合了语音理解与生成能力,支持多语言对话、情感语调、方言、语速和韵律风格控制。
语音识别#多语言
Fireredasr AED L
FireRedASR-AED-L 是一个开源的工业级自动语音识别模型,专为满足高效率和高性能的语音识别需求而设计。
语音识别#开源
Fireredasr
FireRedASR 是一个开源的工业级普通话自动语音识别模型,采用 Encoder-Decoder 和 LLM 集成架构。
语音识别#人工智能
Pengchengstarling
PengChengStarling 是一个专注于多语言自动语音识别(ASR)的开源工具包,基于 icefall 项目开发。
语音识别#自动语音识别
Realtimestt
RealtimeSTT是一个开源的语音识别模型,能够实时将语音转换为文本。
语音识别#实时转录