视频分析 MCP Server精选 | 2025年最佳Model Context Protocol服务器

# 视频分析

视频分析

CameraBench 是一个用于分析视频中相机运动的模型，旨在通过视频理解相机的运动模式。

研究工具#相机运动开源

InternVL3是由OpenGVLab开源发布的多模态大型语言模型（MLLM），具备卓越的多模态感知和推理能力。

AI模型#多模态

SmolVLM2 是一种轻量级的视频语言模型，旨在通过分析视频内容生成相关的文本描述或视频亮点。

视频编辑#文本生成开源

Valley Eagle 7B

Valley-Eagle-7B是由字节跳动开发的多模态大型模型，旨在处理涉及文本、图像和视频数据的多种任务。

AI模型#大型模型开源

Valley是由字节跳动开发的尖端多模态大型模型，能够处理涉及文本、图像和视频数据的多种任务。

AI模型#大型模型开源

video-analyzer是一个视频分析工具，它结合了Llama的11B视觉模型和OpenAI的Whisper模型，通过提取关键帧、将它们输入视觉模型以获取细节，并结合每个帧的细节和可用的转录内容来描述视频中发生的事情。

视频编辑#计算机视觉开源

Internvl2 5 38B MPO

InternVL2.5-MPO是一个先进的多模态大型语言模型系列，基于InternVL2.5和混合偏好优化（MPO）构建。

AI模型#大型语言模型开源

Internvl2 5 38B

InternVL 2.5是OpenGVLab推出的多模态大型语言模型系列，它在InternVL 2.0的基础上进行了显著的训练和测试策略增强，以及数据质量提升。

AI模型#大型语言模型开源

NVIDIA AI Blueprint

NVIDIA AI Blueprint for Video Search and Summarization是一个基于NVIDIA NIM微服务和生成式AI模型的参考工作流程，用于构建能够理解自然语言提示并执行视觉问题回答的视觉AI代理。

AI模型#视频分析

NVIDIA Video Search And Summarization

NVIDIA Video Search and Summarization 是一个利用深度学习和人工智能技术，能够处理大量实时或存档视频，并从中提取信息以进行摘要和交互式问答的模型。

AI搜索#人工智能

Youtube Whisper

Youtube-Whisper是一个基于Gradio的应用程序，它通过提取YouTube视频的音频并使用OpenAI的Whisper模型来转录成文本。

AI语音转文本#音频转录开源

MyLens.ai是一个利用人工智能技术帮助用户深入理解YouTube视频的工具。

视频编辑#视频分析

Open Source Computer Vision Library

OpenCV是一个跨平台的开源计算机视觉和机器学习软件库，它提供了一系列编程功能，包括但不限于图像处理、视频分析、特征检测、机器学习等。

AI图像检测识别#机器学习开源

Doesvideocontain

doesVideoContain是一个利用人工智能在浏览器中检测视频内容的模型。

AI视频编辑#视频分析开源

Videco是一个利用人工智能技术为销售团队提供个性化视频服务的平台，通过AI克隆和动态变量技术，使视频内容更加贴近目标受众，从而提高销售转化率和客户参与度。

销售#视频销售

Qwen2-VL是一款基于Qwen2打造的最新一代视觉语言模型，具备多语言支持和强大的视觉理解能力，能够处理不同分辨率和长宽比的图片，理解长视频，并可集成到手机、机器人等设备中进行自动操作。

AI模型#多语言支持开源

mPLUG-Owl3是一个多模态大型语言模型，专注于长图像序列的理解。

AI模型#图像理解开源

Llava OneVision

LLaVA-OneVision是一款由字节跳动公司与多所大学合作开发的多模态大型模型（LMMs），它在单图像、多图像和视频场景中推动了开放大型多模态模型的性能边界。

AI模型#视觉识别开源

LabelU是一个开源的数据标注工具，适用于需要对图像、视频、音频等数据进行高效标注的场景，以提升机器学习模型的性能和质量。

AI图像检测识别#机器学习开源

Viral Insight 是一款 AI 应用程序，能够预测视频内容的病毒传播性。

视频生成#视频分析

Videollama2 7B Base

VideoLLaMA2-7B-Base 是由 DAMO-NLP-SG 开发的大型视频语言模型，专注于视频内容的理解与生成。

AI视频生成#多模态学习开源

AI课代表是一款专为视频学习设计的智能插件，利用先进的AI技术，为用户提供视频内容总结、知识问答、字幕搜索等功能。

学习教育#视频分析

MASA是一个用于视频帧中对象匹配的先进模型，它能够处理复杂场景中的多目标跟踪（MOT）。

AI视频编辑#目标跟踪开源

Video-MME是一个专注于多模态大型语言模型（MLLMs）在视频分析领域性能评估的基准测试。

AI视频分析#视频分析开源

SAM是一个先进的视频对象分割模型，它结合了光学流动和RGB信息，能够发现并分割视频中的移动对象。

视频编辑#对象分割

Recognito是领先的面部识别技术和高级生物特征算法开发商，通过在NIST FRVT TOP 1中的排名证明。

安全#面部活体检测

Kuasar Video是一个为公司提供人工智能支持的视频解决方案的产品,它具有社交媒体视频分析器、视频评分和视频标签搜索等功能,可以帮助企业对社交媒体上的视频进行评分,并根据评分结果找到最优质的视频标签,从而进行有针对性的内容营销。

视频编辑#人工智能

Gaitanalyzer是一款能够在家中分析步态，帮助用户了解健康状况的工具。

Visionati是一款完整的视觉分析工具包，提供全面的图像和视频描述、标签和内容过滤功能。

数据分析#视频分析

Yogger是一款先进的视频分析应用，可分析运动和步态，跟踪进展，并进行基于AI的运动筛查。

运动分析#AI技术

Video Summarize

video_summarize是一个基于GPT模型的视频内容智能总结工具。

AI视频摘要#内容生成开源

Bibi是一个智能的视频和音频内容总结工具,可以自动生成文本摘要。

写作助手#自然语言处理

Chooch AI Vision

Chooch AI Vision Platform是一款AI视觉平台，通过AI算法实现对图像和视频的实时分析和识别。

AI模型#计算机视觉

Foqus是一个实时基于云端的视频分析服务，为离线业务提供AI视觉超越人眼的能力。

视频分析#视频分析

Eden AI 提供一站式 API 接入，涵盖多种 AI 技术，包括生成式 AI、文本分析、图像分析、视频分析、OCR / 文档解析、语音转录等。

精选AI产品推荐

NoCode 是一款无需编程经验的平台，允许用户通过自然语言描述创意并快速生成应用，旨在降低开发门槛，让更多人能实现他们的创意。

开发平台#应用开发

ListenHub 是一款轻量级的 AI 播客生成工具，支持中文和英语，基于前沿 AI 技术，能够快速生成用户感兴趣的播客内容。

音频生成#AI

Lovart 是一款革命性的 AI 设计代理，能够将创意提示转化为艺术作品，支持从故事板到品牌视觉的多种设计需求。

AI设计工具#创意工具

FastVLM 是一种高效的视觉编码模型，专为视觉语言模型设计。

AI模型#图像处理开源

Smart PDFs 是一个在线工具，利用 AI 技术快速分析 PDF 文档，并生成简明扼要的总结。

文章摘要#AI

KeySync 是一个针对高分辨率视频的无泄漏唇同步框架。

视频编辑#视频处理开源

AnyVoice是一款领先的AI声音生成器，采用先进的深度学习模型，将文本转换为与人类无法区分的自然语音。

音频生成#文本转语音

LiblibAI是一个中国领先的AI创作平台,提供强大的AI创作能力,帮助创作者实现创意。

AI模型#图像生成

AIbase

AIbase是一个专注于MCP服务的平台，为AI开发者提供高质量的模型上下文协议服务，助力AI应用开发。

简体中文

热门AI产品

Deepseek R1 0528

Migo AI文献阅读助手

热门AI产品分类

开发与工具

聊天机器人

热门标签

多语言支持

自然语言处理

© 2025AIbase 备案号：闽ICP备08105208号-24