Denoiser
适用于需要去除噪音的音频录音场景
总访问量: 40,408
占比最多地区: US(25.94%)
2,976
简介
Denoiser是一款iOS应用,可以去除录音中的杂音和噪音,使录音具有专业的音乐工作室效果。通过拖放噪音录音文件,AI算法会自动处理并提升录音质量。用户可以根据需要调整降噪程度,并下载处理后的文件。详细的研究论文可以在官网查阅,欢迎与团队分享您的想法。
截图
产品特色
去除录音中的杂音和噪音
提升录音质量
调整降噪程度
流量来源
直接访问36.90%外链引荐45.37%邮件0.08%
自然搜索8.92%社交媒体8.22%展示广告0.46%
最新流量情况
月访问量
30.17k
平均访问时长
43.71
每次访问页数
2.25
跳出率
39.63%
总流量趋势图
地理流量分布情况
美国
25.94%
印度
9.57%
英国
9.46%
印度尼西亚
7.26%
越南
6.28%
地理流量分布全球图
替代品
Parakeet Tdt 0.6b V2
parakeet-tdt-0.6b-v2 是一个 600 百万参数的自动语音识别(ASR)模型,旨在实现高质量的英语转录,具有准确的时间戳预测和自动标点符号、大小写支持。
语音识别#深度学习
Kimi Audio
Kimi-Audio 是一个先进的开源音频基础模型,旨在处理多种音频处理任务,如语音识别和音频对话。
语音识别#音频处理
Step Audio
Step-Audio是首个生产级开源智能语音交互框架,整合了语音理解与生成能力,支持多语言对话、情感语调、方言、语速和韵律风格控制。
语音识别#多语言
Fireredasr AED L
FireRedASR-AED-L 是一个开源的工业级自动语音识别模型,专为满足高效率和高性能的语音识别需求而设计。
语音识别#开源
Fireredasr
FireRedASR 是一个开源的工业级普通话自动语音识别模型,采用 Encoder-Decoder 和 LLM 集成架构。
语音识别#人工智能
Pengchengstarling
PengChengStarling 是一个专注于多语言自动语音识别(ASR)的开源工具包,基于 icefall 项目开发。
语音识别#自动语音识别
Realtimestt
RealtimeSTT是一个开源的语音识别模型,能够实时将语音转换为文本。
语音识别#实时转录
Minmo
MinMo是阿里巴巴集团通义实验室开发的一款多模态大型语言模型,拥有约80亿参数,专注于实现无缝语音交互。
语音识别#多模态
Betterwhisperx
BetterWhisperX是一个基于WhisperX改进的自动语音识别模型,它能够提供快速的语音转文字服务,并具备词级时间戳和说话人识别功能。
语音识别#词级时间戳