简介
Transcribe ~ Speech to Text是一个语音转文字的iOS应用程序。它利用OpenAI的Whisper技术和Apple的神经引擎,实现语音文件的高精度识别,可将音频和视频文件直接转录成可阅读的文本。支持离线识别和云端识别两种模式。适用于各类语音转文字的需求,使用简单方便。
截图

产品特色
支持多种语音文件直接转录
识别精度高
支持离线和云端两种识别模式
简单易用
流量来源
直接访问 | 39.70% | 外链引荐 | 29.80% | 邮件 | 0.13% |
自然搜索 | 23.79% | 社交媒体 | 3.16% | 展示广告 | 3.42% |
最新流量情况
月访问量
1.17m
平均访问时长
49.85
每次访问页数
1.54
跳出率
74.30%
总流量趋势图
地理流量分布情况
美国
28.84%
日本
6.55%
中国
5.79%
英国
3.53%
印度
3.48%
地理流量分布全球图
同类开源产品

Funasr
FunASR是一款语音离线文件转写服务软件包,集成了语音端点检测、语音识别、标点等模型,能够将长音频与视频转换成带标点的文字,并支持多路请求同时转写。
AI语音转文本#语音转写

Asrtools
AsrTools是一款基于人工智能技术的语音转文字工具,它通过调用大厂的ASR服务接口,实现了无需GPU和复杂配置的高效语音识别功能。
AI语音转文本#ASR服务

园丁提词器
园丁提词器是一款专为直播、演讲、教学等场景设计的桌面提词器应用。
AI语音转文本#演讲

Kaption AI
Kaption AI是一款Chrome浏览器插件,它利用人工智能技术将WhatsApp上的音频消息转换成文字,并提供消息摘要和回复建议。
AI语音转文本#音频转文字

Trailmate
TrailMate是一款专为户外探险设计的离线AI伴侣应用。
AI应用生成#探险

Rev AI
国外精选
Rev AI提供高精度的语音转录服务,支持58种以上语言,能够将视频和语音应用中的语音转换为文本。
AI语音转文本#转录服务

Youtube Whisper
Youtube-Whisper是一个基于Gradio的应用程序,它通过提取YouTube视频的音频并使用OpenAI的Whisper模型来转录成文本。
AI语音转文本#音频转录

Urban Green
Urban Green 是一款旨在通过植物共享来促进城市绿化和可持续生活的应用程序。
AI应用生成#社区共享

Babelfish.ai
优质新品
babelfish.ai 是一个基于浏览器的实时语音转文字和翻译应用。
AI语音转文本#多语言翻译
替代品

Funasr
FunASR是一款语音离线文件转写服务软件包,集成了语音端点检测、语音识别、标点等模型,能够将长音频与视频转换成带标点的文字,并支持多路请求同时转写。
AI语音转文本#语音转写

Asrtools
AsrTools是一款基于人工智能技术的语音转文字工具,它通过调用大厂的ASR服务接口,实现了无需GPU和复杂配置的高效语音识别功能。
AI语音转文本#ASR服务

Youtube Whisper
Youtube-Whisper是一个基于Gradio的应用程序,它通过提取YouTube视频的音频并使用OpenAI的Whisper模型来转录成文本。
AI语音转文本#音频转录

Babelfish.ai
优质新品
babelfish.ai 是一个基于浏览器的实时语音转文字和翻译应用。
AI语音转文本#多语言翻译

Comfyui Bxb
ComfyUI_Bxb插件能够将现有的comfyui工作流一键转换为微信小程序、抖音小程序、微信内H5和微信外H5等多种形式,支持支付变现,极大地提高了工作效率和灵活性。
AI应用生成#小程序

West
WeST是一个开源的语音识别转录模型,以300行代码的简洁形式,基于大型语言模型(LLM)实现语音到文本的转换。
AI语音转文本#自然语言处理

Atrain
aTrain是由格拉茨大学商业分析与数据科学中心的研究人员开发,并由格拉茨知识中心的研究人员测试的一款离线语音转录工具。
AI语音转文本#机器学习

Awesome Gptlike Shellsite
本指南涵盖从选择套壳站、部署流程、订阅API、运营策略等全方位内容,助您快速部署属于自己的GPT服务,实现平台商业化。
AI应用生成#套壳站
精选AI产品推荐

Nocode
中文精选
NoCode 是一款无需编程经验的平台,允许用户通过自然语言描述创意并快速生成应用,旨在降低开发门槛,让更多人能实现他们的创意。
开发平台#应用开发
912

Listenhub
优质新品
ListenHub 是一款轻量级的 AI 播客生成工具,支持中文和英语,基于前沿 AI 技术,能够快速生成用户感兴趣的播客内容。
音频生成#AI
348

Lovart
国外精选
Lovart 是一款革命性的 AI 设计代理,能够将创意提示转化为艺术作品,支持从故事板到品牌视觉的多种设计需求。
AI设计工具#创意工具
1,128

Fastvlm
FastVLM 是一种高效的视觉编码模型,专为视觉语言模型设计。
AI模型#图像处理开源
564

Smart PDFs
国外精选
Smart PDFs 是一个在线工具,利用 AI 技术快速分析 PDF 文档,并生成简明扼要的总结。
文章摘要#AI
984

Keysync
KeySync 是一个针对高分辨率视频的无泄漏唇同步框架。
视频编辑#视频处理开源
480

Anyvoice
AnyVoice是一款领先的AI声音生成器,采用先进的深度学习模型,将文本转换为与人类无法区分的自然语音。
音频生成#文本转语音
26.38k

Liblibai
中文精选
LiblibAI是一个中国领先的AI创作平台,提供强大的AI创作能力,帮助创作者实现创意。
AI模型#图像生成
344.42k