AI Based Live Captioning System
AI Based Live Captioning System
适用于各类会议和会议服务,如在线会议、视频会议、远程教育等。
总访问量: 658
1,104
简介
AI实时字幕服务是一款基于人工智能的在线字幕服务,可以实时为会议或会议服务提供字幕和交互式转录。无需编程即可轻松集成到您的服务中。支持多种语言和方言,提供实时的字幕数据,帮助提升会议的可访问性和用户体验。
截图
产品特色
实时字幕和交互式转录
快速集成到现有服务
支持多种语言和方言
提供实时的字幕数据
提升会议的可访问性和用户体验
流量来源
直接访问0.00%外链引荐0.00%邮件0.00%
自然搜索0.00%社交媒体0.00%展示广告0.00%
最新流量情况
月访问量
0
平均访问时长
0.00
每次访问页数
0.00
跳出率
0
总流量趋势图
同类开源产品
Schedo
Schedo是一款AI智能会议调度器,帮助用户简化预约流程、接受付款并促进业务增长。
会议助手#automated booking
Parakeet Tdt 0.6b V2
parakeet-tdt-0.6b-v2 是一个 600 百万参数的自动语音识别(ASR)模型,旨在实现高质量的英语转录,具有准确的时间戳预测和自动标点符号、大小写支持。
语音识别#深度学习
Live Portals | Custom Video Conferencing
Live & Interactive Video Conferencing是一款强大的视频会议平台,提供高清视频和音频以及实时功能,如聊天、文件共享和屏幕共享。
会议助手#协作工具
Slpeacebot
SLPeaceBot™是一款使用语音完成会话记录的工具,节省超过260小时的时间。
会议助手#会话记录
Kimi Audio
Kimi-Audio 是一个先进的开源音频基础模型,旨在处理多种音频处理任务,如语音识别和音频对话。
语音识别#音频处理
听脑 AI
中文精选
听脑 AI 是一个专业的智能 AI 会议助手,提供一站式的智能会议服务,旨在提高会议效率。
会议助手#语音转写
Amazon Nova Sonic
Amazon Nova Sonic 是一款前沿的基础模型,能够整合语音理解和生成,提升人机对话的自然流畅度。
语音识别#人工智能
英飞·思想家
中文精选
英飞·思想家是一个AIGC赋能的可视化在线协作空间,旨在通过无限画布、音视频会议、思维导图等功能,为企业和团队提供高效协作的数字平台。
会议助手#AIGC
Durt
DuRT 是一款专注于 macOS 系统的语音识别和翻译工具。
语音识别#翻译
替代品
Parakeet Tdt 0.6b V2
parakeet-tdt-0.6b-v2 是一个 600 百万参数的自动语音识别(ASR)模型,旨在实现高质量的英语转录,具有准确的时间戳预测和自动标点符号、大小写支持。
语音识别#深度学习
Kimi Audio
Kimi-Audio 是一个先进的开源音频基础模型,旨在处理多种音频处理任务,如语音识别和音频对话。
语音识别#音频处理
Step Audio
Step-Audio是首个生产级开源智能语音交互框架,整合了语音理解与生成能力,支持多语言对话、情感语调、方言、语速和韵律风格控制。
语音识别#多语言
Fireredasr AED L
FireRedASR-AED-L 是一个开源的工业级自动语音识别模型,专为满足高效率和高性能的语音识别需求而设计。
语音识别#开源
Fireredasr
FireRedASR 是一个开源的工业级普通话自动语音识别模型,采用 Encoder-Decoder 和 LLM 集成架构。
语音识别#人工智能
Pengchengstarling
PengChengStarling 是一个专注于多语言自动语音识别(ASR)的开源工具包,基于 icefall 项目开发。
语音识别#自动语音识别
Realtimestt
RealtimeSTT是一个开源的语音识别模型,能够实时将语音转换为文本。
语音识别#实时转录
Minmo
MinMo是阿里巴巴集团通义实验室开发的一款多模态大型语言模型,拥有约80亿参数,专注于实现无缝语音交互。
语音识别#多模态
Betterwhisperx
BetterWhisperX是一个基于WhisperX改进的自动语音识别模型,它能够提供快速的语音转文字服务,并具备词级时间戳和说话人识别功能。
语音识别#词级时间戳