# 自动语音识别
自动语音识别
Parakeet Tdt 0.6b V2
parakeet-tdt-0.6b-v2 是一个 600 百万参数的自动语音识别(ASR)模型,旨在实现高质量的英语转录,具有准确的时间戳预测和自动标点符号、大小写支持。
语音识别#深度学习开源
588
Pengchengstarling
PengChengStarling 是一个专注于多语言自动语音识别(ASR)的开源工具包,基于 icefall 项目开发。
语音识别#自动语音识别开源
948
Betterwhisperx
BetterWhisperX是一个基于WhisperX改进的自动语音识别模型,它能够提供快速的语音转文字服务,并具备词级时间戳和说话人识别功能。
语音识别#词级时间戳开源
2,436
Moonshine Web
Moonshine Web是一个基于React和Vite构建的简单应用,它运行了Moonshine Base,这是一个针对快速准确自动语音识别(ASR)优化的强大语音识别模型,适用于资源受限的设备。
语音识别#自动语音识别开源
816
Whisper Ner V1
Whisper-NER是一个创新的模型,它允许同时进行语音转录和实体识别。
#实体识别开源
648
Whisperner
WhisperNER是一个结合了自动语音识别(ASR)和命名实体识别(NER)的统一模型,具备零样本能力。
#命名实体识别开源
468
Moonshine
Moonshine 是一系列为资源受限设备优化的语音转文本模型,非常适合实时、设备上的应用程序,如现场转录和语音命令识别。
语音识别#边缘计算开源
1,116
Whisper Large V3 Turbo
优质新品
Whisper large-v3-turbo是OpenAI提出的一种先进的自动语音识别(ASR)和语音翻译模型。
AI语音识别#语音翻译开源
2,952
Crisperwhisper
CrisperWhisper是基于OpenAI的Whisper模型的高级变体,专为快速、准确、逐字的语音识别设计,提供准确的词级时间戳。
AI语音识别#逐字转录开源
1,164
Seed Tts Eval
seed-tts-eval 是一个用于评估模型零样本语音生成能力的测试集,它提供了一个跨领域目标的客观评估测试集,包含从英语和普通话公共语料库中提取的样本,用于衡量模型在各种客观指标上的表现。
AI模型#自动语音识别开源
3,996
Whisperkit
WhisperKit是一个用于自动语音识别模型压缩与优化的工具。
AI语音识别#模型压缩开源
3,708
Speechflow Advanced Speech To Text API
SpeechFlow是一款强大的语音转文字API,可在13种语言中以极高的准确率进行转录。
AI语音转文本#自动语音识别
912