Funclip
目标受众为视频编辑者、内容创作者、教育机构以及需要视频剪辑功能的企业用户。FunClip适合他们因为它提供精准的语音识别和灵活的视频裁剪功能,帮助他们提高工作效率,同时开源的特性也方便了技术的二次开发和定制。
总访问量: 474,564,576
占比最多地区: US(19.34%)
7,740
简介
FunClip是一款完全开源、本地部署的自动化视频剪辑工具,通过调用阿里巴巴通义实验室开源的FunASR Paraformer系列模型进行视频的语音识别,随后用户可以自由选择识别结果中的文本片段或说话人,点击裁剪按钮即可获取对应片段的视频。FunClip集成了阿里巴巴开源的工业级模型Paraformer-Large,是当前识别效果最优的开源中文ASR模型之一,并且能够一体化的准确预测时间戳。
截图
产品特色
集成Paraformer-Large模型,提供高精度的中文语音识别
支持热词定制化功能,提升特定实体词、人名的识别效果
集成CAM++说话人识别模型,可裁剪特定说话人的视频段落
通过Gradio交互实现功能,简单易用
支持多段自由剪辑,自动生成SRT字幕
本地部署,保护用户隐私
支持命令行调用,适合开发者使用
即将集成Whisper模型,扩展英文视频剪辑能力
使用教程
克隆FunClip仓库到本地
安装所需的Python依赖
安装imagemagick(如果需要自动生成字幕)
在本地启动Gradio服务,通过浏览器访问并使用界面进行视频剪辑
或者通过命令行调用FunClip的相关功能进行视频识别和裁剪
使用Modelscope创空间体验FunClip
流量来源
直接访问51.61%外链引荐33.46%邮件0.04%
自然搜索12.58%社交媒体2.19%展示广告0.11%
最新流量情况
月访问量
4.92m
平均访问时长
393.01
每次访问页数
6.11
跳出率
36.20%
总流量趋势图
地理流量分布情况
美国
19.34%
中国
13.25%
印度
9.32%
俄罗斯
4.28%
德国
3.63%
地理流量分布全球图
同类开源产品
Gstory
国外精选
GStory是一个在线视频和图片编辑平台,提供多种智能编辑功能,如背景更换、增强器、水印去除和AI图像生成器。
AI视频编辑#图片编辑
Talking Avatar
Talking Avatar是一款利用人工智能技术,允许用户通过编辑文本来更新旁白,无需重新录制,即可改变声音,包括口音、语调和情感。
AI视频编辑#视频编辑
Sieve Eye Contact Correction
Sieve Eye Contact Correction API 是一个为开发者设计的快速且高质量的视频眼神校正API。
AI视频编辑#视频处理
Video Background Removal
Video Background Removal 是一个由 innova-ai 提供的 Hugging Face Space,专注于视频背景移除技术。
AI视频编辑#背景移除
Eddie AI
国外精选
Eddie AI是一个创新的视频编辑平台,它利用人工智能技术帮助用户快速、轻松地编辑视频。
AI视频编辑#自定义模型
Reverb
Reverb 是一个开源的语音识别和说话人分割模型推理代码,使用 WeNet 框架进行语音识别 (ASR) 和 Pyannote 框架进行说话人分割。
AI语音识别#说话人分割
Voice Pro
Voice-Pro是一个集成的字幕、翻译和文本到语音(TTS)解决方案。
AI视频编辑#TTS
Whisper Large V3 Turbo
优质新品
Whisper large-v3-turbo是OpenAI提出的一种先进的自动语音识别(ASR)和语音翻译模型。
AI语音识别#语音翻译
Realtime API
国外精选
Realtime API 是 OpenAI 推出的一款低延迟语音交互API,它允许开发者在应用程序中构建快速的语音到语音体验。
AI语音识别#低延迟
替代品
Video Background Removal
Video Background Removal 是一个由 innova-ai 提供的 Hugging Face Space,专注于视频背景移除技术。
AI视频编辑#背景移除
Reverb
Reverb 是一个开源的语音识别和说话人分割模型推理代码,使用 WeNet 框架进行语音识别 (ASR) 和 Pyannote 框架进行说话人分割。
AI语音识别#说话人分割
Voice Pro
Voice-Pro是一个集成的字幕、翻译和文本到语音(TTS)解决方案。
AI视频编辑#TTS
Whisper Large V3 Turbo
优质新品
Whisper large-v3-turbo是OpenAI提出的一种先进的自动语音识别(ASR)和语音翻译模型。
AI语音识别#语音翻译
Elevenlabsdubbinggradio
ElevenLabs Video Dubbing Application 是一个用户友好的界面,用于使用 ElevenLabs API 配音视频。
AI视频编辑#多语言
Omnisensevoice
OmniSenseVoice是基于SenseVoice优化的语音识别模型,专为快速推理和精确时间戳设计,提供更智能、更快速的音频转录方式。
AI语音识别#时间戳
Portraitgen
PortraitGen是一个基于多模态生成先验的2D肖像视频编辑工具,能够将2D肖像视频提升到4D高斯场,实现多模态肖像编辑。
AI视频编辑#3D肖像
AI Youtube Shorts Generator
AI Youtube Shorts Generator 是一个利用GPT-4和Whisper技术的Python工具,它可以从长视频中提取最有趣的亮点,检测演讲者,并将内容垂直裁剪,以适应短片格式。
AI视频编辑#视频编辑
Doesvideocontain
doesVideoContain是一个利用人工智能在浏览器中检测视频内容的模型。
AI视频编辑#视频分析