# 视频分析
视频分析
Camerabench
CameraBench 是一个用于分析视频中相机运动的模型,旨在通过视频理解相机的运动模式。
研究工具#相机运动开源
396
Internvl3
优质新品
InternVL3是由OpenGVLab开源发布的多模态大型语言模型(MLLM),具备卓越的多模态感知和推理能力。
AI模型#多模态
2,976
Smolvlm2
SmolVLM2 是一种轻量级的视频语言模型,旨在通过分析视频内容生成相关的文本描述或视频亮点。
视频编辑#文本生成开源
1,680
Valley Eagle 7B
Valley-Eagle-7B是由字节跳动开发的多模态大型模型,旨在处理涉及文本、图像和视频数据的多种任务。
AI模型#大型模型开源
864
Valley
Valley是由字节跳动开发的尖端多模态大型模型,能够处理涉及文本、图像和视频数据的多种任务。
AI模型#大型模型开源
768
Video Analyzer
video-analyzer是一个视频分析工具,它结合了Llama的11B视觉模型和OpenAI的Whisper模型,通过提取关键帧、将它们输入视觉模型以获取细节,并结合每个帧的细节和可用的转录内容来描述视频中发生的事情。
视频编辑#计算机视觉开源
8,940
Internvl2 5 38B MPO
InternVL2.5-MPO是一个先进的多模态大型语言模型系列,基于InternVL2.5和混合偏好优化(MPO)构建。
AI模型#大型语言模型开源
888
Internvl2 5 38B
InternVL 2.5是OpenGVLab推出的多模态大型语言模型系列,它在InternVL 2.0的基础上进行了显著的训练和测试策略增强,以及数据质量提升。
AI模型#大型语言模型开源
1,128
NVIDIA AI Blueprint
NVIDIA AI Blueprint for Video Search and Summarization是一个基于NVIDIA NIM微服务和生成式AI模型的参考工作流程,用于构建能够理解自然语言提示并执行视觉问题回答的视觉AI代理。
AI模型#视频分析
696
NVIDIA Video Search And Summarization
NVIDIA Video Search and Summarization 是一个利用深度学习和人工智能技术,能够处理大量实时或存档视频,并从中提取信息以进行摘要和交互式问答的模型。
AI搜索#人工智能
1,164
Youtube Whisper
Youtube-Whisper是一个基于Gradio的应用程序,它通过提取YouTube视频的音频并使用OpenAI的Whisper模型来转录成文本。
AI语音转文本#音频转录开源
912
Mylens.ai
优质新品
MyLens.ai是一个利用人工智能技术帮助用户深入理解YouTube视频的工具。
视频编辑#视频分析
876
Open Source Computer Vision Library
OpenCV是一个跨平台的开源计算机视觉和机器学习软件库,它提供了一系列编程功能,包括但不限于图像处理、视频分析、特征检测、机器学习等。
AI图像检测识别#机器学习开源
384
Doesvideocontain
doesVideoContain是一个利用人工智能在浏览器中检测视频内容的模型。
AI视频编辑#视频分析开源
3,360
Videco
Videco是一个利用人工智能技术为销售团队提供个性化视频服务的平台,通过AI克隆和动态变量技术,使视频内容更加贴近目标受众,从而提高销售转化率和客户参与度。
销售#视频销售
552
Qwen2 VL
Qwen2-VL是一款基于Qwen2打造的最新一代视觉语言模型,具备多语言支持和强大的视觉理解能力,能够处理不同分辨率和长宽比的图片,理解长视频,并可集成到手机、机器人等设备中进行自动操作。
AI模型#多语言支持开源
1,092
Mplug Owl3
mPLUG-Owl3是一个多模态大型语言模型,专注于长图像序列的理解。
AI模型#图像理解开源
624
Llava OneVision
LLaVA-OneVision是一款由字节跳动公司与多所大学合作开发的多模态大型模型(LMMs),它在单图像、多图像和视频场景中推动了开放大型多模态模型的性能边界。
AI模型#视觉识别开源
1,680
Labelu
优质新品
LabelU是一个开源的数据标注工具,适用于需要对图像、视频、音频等数据进行高效标注的场景,以提升机器学习模型的性能和质量。
AI图像检测识别#机器学习开源
1,428
Viral Insight
Viral Insight 是一款 AI 应用程序,能够预测视频内容的病毒传播性。
视频生成#视频分析
876
Videollama2 7B Base
VideoLLaMA2-7B-Base 是由 DAMO-NLP-SG 开发的大型视频语言模型,专注于视频内容的理解与生成。
AI视频生成#多模态学习开源
1,812
AI课代表
中文精选
AI课代表是一款专为视频学习设计的智能插件,利用先进的AI技术,为用户提供视频内容总结、知识问答、字幕搜索等功能。
学习教育#视频分析
12.98k
MASA
优质新品
MASA是一个用于视频帧中对象匹配的先进模型,它能够处理复杂场景中的多目标跟踪(MOT)。
AI视频编辑#目标跟踪开源
1,116
Video MME
Video-MME是一个专注于多模态大型语言模型(MLLMs)在视频分析领域性能评估的基准测试。
AI视频分析#视频分析开源
1,584
SAM
SAM是一个先进的视频对象分割模型,它结合了光学流动和RGB信息,能够发现并分割视频中的移动对象。
视频编辑#对象分割
804
On
Recognito是领先的面部识别技术和高级生物特征算法开发商,通过在NIST FRVT TOP 1中的排名证明。
安全#面部活体检测
1,416
Kuasar Video
Kuasar Video是一个为公司提供人工智能支持的视频解决方案的产品,它具有社交媒体视频分析器、视频评分和视频标签搜索等功能,可以帮助企业对社交媒体上的视频进行评分,并根据评分结果找到最优质的视频标签,从而进行有针对性的内容营销。
视频编辑#人工智能
1,032
Gaitanalyzer
Gaitanalyzer是一款能够在家中分析步态,帮助用户了解健康状况的工具。
健康#医疗
732
Visionati
Visionati是一款完整的视觉分析工具包,提供全面的图像和视频描述、标签和内容过滤功能。
数据分析#视频分析
1,380
Yogger
Yogger是一款先进的视频分析应用,可分析运动和步态,跟踪进展,并进行基于AI的运动筛查。
运动分析#AI技术
900
Video Summarize
video_summarize是一个基于GPT模型的视频内容智能总结工具。
AI视频摘要#内容生成开源
5,844
Bibigpt
中文精选
Bibi是一个智能的视频和音频内容总结工具,可以自动生成文本摘要。
写作助手#自然语言处理
56.36k
Chooch AI Vision
Chooch AI Vision Platform是一款AI视觉平台,通过AI算法实现对图像和视频的实时分析和识别。
AI模型#计算机视觉
576
Foqus
Foqus是一个实时基于云端的视频分析服务,为离线业务提供AI视觉超越人眼的能力。
视频分析#视频分析
384
Eden AI
Eden AI 提供一站式 API 接入,涵盖多种 AI 技术,包括生成式 AI、文本分析、图像分析、视频分析、OCR / 文档解析、语音转录等。
API服务#API
1,212