Voice Pro : AI语音转录、翻译和TTS的Gradio Web-UI

Voice Pro

Voice Pro

AI视频编辑 AI翻译 #翻译 #TTS #Whisper #ASR #Faster-Whisper 普通产品开源

简介 :

Voice-Pro是一个集成的字幕、翻译和文本到语音(TTS)解决方案。它支持将视频添加多语言字幕和多语言音频，助力视频内容扩展到全球市场。该产品使用OpenAI Whisper和开源翻译器及TTS技术，提供一键安装和便携式使用。它还配备了Vocal Remover，使用UVR5和Meta的Demucs引擎，以提高语音识别的准确性。

需求人群 :

Voice-Pro的目标受众是视频内容创作者、翻译工作者、字幕制作者和任何需要进行语音识别和文本到语音转换的用户。它特别适合那些希望将视频内容本地化到不同语言的创作者，以及需要实时翻译功能的专业人士。

总访问量： 474.6M

占比最多地区： US(19.34%)

本站浏览量： 79.8K

使用场景

将YouTube视频下载并添加多语言字幕后重新上传。

实时翻译直播内容并生成字幕。

批量处理视频文件，添加字幕和翻译。

产品特色

提供YouTube下载器、降噪、字幕、翻译和TTS的集成环境。

支持ffmpeg支持的所有视频/音频格式。

可选择输出音频格式（wav, flac, mp3）。

支持100种语言的语音识别和字幕创建。

支持翻译成超过100种语言，并进行TTS语音生成。

保留原始视频中的背景音乐和音效。

支持TTS语音速度、音量和音调调整。

支持实时语音识别和翻译。

支持批量处理大量文件。

使用教程

1. 准备软件包：解压付费版或免费版压缩文件到电脑上的适当位置。

2. 安装并运行程序：运行configure.bat安装ffmpeg和CUDA（如果使用NVIDIA GPU）。

3. 运行start.bat启动Voice-Pro，Web-UI将自动运行。

4. 如果首次运行，Voice-Pro将先进行安装，需要互联网连接，安装可能超过一小时。

5. 不要在安装过程中关闭Windows命令窗口。

6. 如果安装过程中出现问题，删除installer_files文件夹并重新运行start.bat。

7. 如果浏览器没有自动运行，关闭Windows命令窗口并重新运行start.bat，或直接在浏览器中输入Windows命令窗口显示的地址。

精选AI产品推荐

Motionshop是一个 AI 角色动画的网站，它能够根据上传的视频自动检测视频中的人物，并替换成 3D 卡通角色模型，生成有趣的 AI 视频。该产品提供简单易用的界面和强大的 AI 算法，让用户能够轻松将自己的视频内容转化为生动有趣的动画作品。

AI视频编辑3D 模型

Video Subtitle Remover (VSR)

Video-subtitle-remover (VSR) 是一款基于AI技术，将视频中的硬字幕去除的软件。主要功能包括无损分辨率去除视频中的硬字幕，通过AI算法模型对去除字幕的区域进行填充，支持自定义字幕位置去除，以及批量去除图片水印文本。优势在于无需第三方API，本地实现，操作简便，效果显著。

AI视频编辑视频编辑

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24