简介
StreamSpeech是一款基于多任务学习的实时语音到语音翻译模型。它通过统一框架同时学习翻译和同步策略,有效识别流式语音输入中的翻译时机,实现高质量的实时通信体验。该模型在CVSS基准测试中取得了领先的性能,并能提供低延迟的中间结果,如ASR或翻译结果。
截图

产品特色
支持流式语音识别(ASR)
支持非自回归语音到文本翻译(NAR-S2TT)
支持语音到单元翻译(S2UT)
能够实时生成目标语音
在翻译过程中提供高质量的中间结果
支持多种语言的翻译,如法英、西班牙英、德英等
使用教程
1. 访问StreamSpeech网站并了解产品基本信息。
2. 选择源语言和目标语言,根据需要进行设置。
3. 上传或实时输入源语言的语音数据。
4. 系统将自动识别语音并进行翻译。
5. 翻译后的语音将以目标语言的形式输出。
6. 在翻译过程中,可以实时查看中间的ASR或翻译结果。
7. 根据反馈调整翻译参数,优化翻译质量。
流量来源
直接访问 | 50.00% | 外链引荐 | 0.00% | 邮件 | 0.00% |
自然搜索 | 50.00% | 社交媒体 | 0.00% | 展示广告 | 0.00% |
最新流量情况
月访问量
33
平均访问时长
0.00
每次访问页数
1.01
跳出率
45.62%
总流量趋势图
地理流量分布情况
日本
100.00%
地理流量分布全球图
同类开源产品

Aidge
Aidge是一款专为电商领域设计的智能翻译工具,提供精准且流畅的翻译服务,支持多种语言,并能根据特定场景进行翻译适配。
AI翻译#电商

Funasr
FunASR是一款语音离线文件转写服务软件包,集成了语音端点检测、语音识别、标点等模型,能够将长音频与视频转换成带标点的文字,并支持多路请求同时转写。
AI语音转文本#语音转写

Asrtools
AsrTools是一款基于人工智能技术的语音转文字工具,它通过调用大厂的ASR服务接口,实现了无需GPU和复杂配置的高效语音识别功能。
AI语音转文本#ASR服务

园丁提词器
园丁提词器是一款专为直播、演讲、教学等场景设计的桌面提词器应用。
AI语音转文本#演讲

Quetzal
优质新品
Quetzal是一个现代国际化平台,旨在帮助用户快速将产品翻译成多种语言,以获得全球新客户。
AI翻译#多语言支持

Kaption AI
Kaption AI是一款Chrome浏览器插件,它利用人工智能技术将WhatsApp上的音频消息转换成文字,并提供消息摘要和回复建议。
AI语音转文本#音频转文字

Rev AI
国外精选
Rev AI提供高精度的语音转录服务,支持58种以上语言,能够将视频和语音应用中的语音转换为文本。
AI语音转文本#转录服务

Youtube Whisper
Youtube-Whisper是一个基于Gradio的应用程序,它通过提取YouTube视频的音频并使用OpenAI的Whisper模型来转录成文本。
AI语音转文本#音频转录

腾讯翻译君
腾讯翻译君是腾讯公司推出的在线翻译服务,它利用先进的人工智能技术,为用户提供文本、图片和文档的翻译服务。
AI翻译#人工智能
替代品

Funasr
FunASR是一款语音离线文件转写服务软件包,集成了语音端点检测、语音识别、标点等模型,能够将长音频与视频转换成带标点的文字,并支持多路请求同时转写。
AI语音转文本#语音转写

Asrtools
AsrTools是一款基于人工智能技术的语音转文字工具,它通过调用大厂的ASR服务接口,实现了无需GPU和复杂配置的高效语音识别功能。
AI语音转文本#ASR服务

Youtube Whisper
Youtube-Whisper是一个基于Gradio的应用程序,它通过提取YouTube视频的音频并使用OpenAI的Whisper模型来转录成文本。
AI语音转文本#音频转录

Babelfish.ai
优质新品
babelfish.ai 是一个基于浏览器的实时语音转文字和翻译应用。
AI语音转文本#多语言翻译

West
WeST是一个开源的语音识别转录模型,以300行代码的简洁形式,基于大型语言模型(LLM)实现语音到文本的转换。
AI语音转文本#自然语言处理

Real Time Translation Typing
Real-time-translation-typing 是一款集成了实时打字翻译、语音实时打字和翻译、LOL 语音打字功能的软件。
AI翻译#语音输入

Parseltongue
Parseltongue 是一款功能强大的浏览器扩展,支持文本转换和实时标记可视化。
AI翻译#标记可视化

CLASI
优质新品
CLASI是一个由字节跳动研究团队开发的高质量、类人同声传译系统。
AI翻译#多语言

Atrain
aTrain是由格拉茨大学商业分析与数据科学中心的研究人员开发,并由格拉茨知识中心的研究人员测试的一款离线语音转录工具。
AI语音转文本#机器学习
精选AI产品推荐

Nocode
中文精选
NoCode 是一款无需编程经验的平台,允许用户通过自然语言描述创意并快速生成应用,旨在降低开发门槛,让更多人能实现他们的创意。
开发平台#应用开发
912

Listenhub
优质新品
ListenHub 是一款轻量级的 AI 播客生成工具,支持中文和英语,基于前沿 AI 技术,能够快速生成用户感兴趣的播客内容。
音频生成#AI
348

Lovart
国外精选
Lovart 是一款革命性的 AI 设计代理,能够将创意提示转化为艺术作品,支持从故事板到品牌视觉的多种设计需求。
AI设计工具#创意工具
1,128

Fastvlm
FastVLM 是一种高效的视觉编码模型,专为视觉语言模型设计。
AI模型#图像处理开源
564

Smart PDFs
国外精选
Smart PDFs 是一个在线工具,利用 AI 技术快速分析 PDF 文档,并生成简明扼要的总结。
文章摘要#AI
984

Keysync
KeySync 是一个针对高分辨率视频的无泄漏唇同步框架。
视频编辑#视频处理开源
480

Anyvoice
AnyVoice是一款领先的AI声音生成器,采用先进的深度学习模型,将文本转换为与人类无法区分的自然语音。
音频生成#文本转语音
26.38k

Liblibai
中文精选
LiblibAI是一个中国领先的AI创作平台,提供强大的AI创作能力,帮助创作者实现创意。
AI模型#图像生成
344.42k