SA V Dataset
目标受众为计算机视觉领域的研究人员和开发者,尤其是那些专注于目标分割技术的研究者。SA-V Dataset提供了丰富的视频数据和分割掩模,有助于他们开发和改进目标分割算法,推动计算机视觉技术的发展。
总访问量: 1,186,988
占比最多地区: US(32.03%)
2,148
简介
SA-V Dataset是一个专为训练通用目标分割模型设计的开放世界视频数据集,包含51K个多样化视频和643K个时空分割掩模(masklets)。该数据集用于计算机视觉研究,允许在CC BY 4.0许可下使用。视频内容多样,包括地点、对象和场景等主题,掩模从建筑物等大规模对象到室内装饰等细节不等。
截图
产品特色
包含51K个视频和643K个时空分割掩模
用于训练和评估通用目标分割模型
提供大规模视频数据集的开放访问
视频分辨率平均为1401×1037像素
没有视频或掩模注释的类别标签
训练集掩模以COCO运行长度编码(RLE)格式提供,验证和测试集以PNG格式提供
所有643K掩模注释均经人工审核和验证
使用教程
1. 访问SA-V Dataset的官方网页。
2. 点击下载数据集以获取视频和掩模文件。
3. 阅读相关论文以了解数据集的详细结构和使用方式。
4. 使用数据集进行目标分割模型的训练或评估。
5. 根据需要,将模型生成的掩模与人工注释的掩模进行比较和验证。
6. 利用数据集进行计算机视觉领域的研究或开发工作。
流量来源
直接访问34.72%外链引荐50.02%邮件0.07%
自然搜索10.24%社交媒体4.69%展示广告0.26%
最新流量情况
月访问量
1900.01k
平均访问时长
86.52
每次访问页数
1.58
跳出率
67.95%
总流量趋势图
地理流量分布情况
美国
32.03%
印度
10.42%
中国
3.66%
英国
3.20%
德国
3.12%
地理流量分布全球图
同类开源产品
Esearch
eSearch 是一款基于Electron开发的跨平台屏幕搜索和截屏软件,支持Linux、Windows和Mac系统。
AI图像检测识别#OCR
Image Describer
Image Describer图像描述生成器是一款利用人工智能技术,通过上传图像并根据用户需求输出图像描述的工具。
AI图像检测识别#文本转语音
Viewly
Viewly是一款强大的AI图片识别应用,它能够识别图片中的内容,并通过AI技术进行作诗和翻译成多国语言。
AI图像检测识别#图像识别
Pimeyes
PimEyes是一个利用面部识别技术提供反向图片搜索服务的网站,用户可以通过上传照片来查找互联网上与该照片相似的图片或个人信息。
AI图像检测识别#反向图片搜索
YOLO11
Ultralytics YOLO11是基于之前YOLO系列模型的进一步发展,引入了新特性和改进,以提高性能和灵活性。
AI图像检测识别#机器学习
Revisit Anything
Revisit Anything 是一个视觉位置识别系统,通过图像片段检索技术,能够识别和匹配不同图像中的位置。
AI图像检测识别#图像检索
Joy Caption Alpha One
Joy Caption Alpha One 是一款基于人工智能的图像描述生成器,能够将图片内容转化为文字描述。
AI图像检测识别#图像识别
Open Source Computer Vision Library
OpenCV是一个跨平台的开源计算机视觉和机器学习软件库,它提供了一系列编程功能,包括但不限于图像处理、视频分析、特征检测、机器学习等。
AI图像检测识别#机器学习
GOT OCR2.0
GOT-OCR2.0是一个开源的OCR模型,旨在通过一个统一的端到端模型推动光学字符识别技术向OCR-2.0迈进。
AI图像检测识别#深度学习
替代品
Esearch
eSearch 是一款基于Electron开发的跨平台屏幕搜索和截屏软件,支持Linux、Windows和Mac系统。
AI图像检测识别#OCR
Revisit Anything
Revisit Anything 是一个视觉位置识别系统,通过图像片段检索技术,能够识别和匹配不同图像中的位置。
AI图像检测识别#图像检索
Joy Caption Alpha One
Joy Caption Alpha One 是一款基于人工智能的图像描述生成器,能够将图片内容转化为文字描述。
AI图像检测识别#图像识别
Open Source Computer Vision Library
OpenCV是一个跨平台的开源计算机视觉和机器学习软件库,它提供了一系列编程功能,包括但不限于图像处理、视频分析、特征检测、机器学习等。
AI图像检测识别#机器学习
GOT OCR2.0
GOT-OCR2.0是一个开源的OCR模型,旨在通过一个统一的端到端模型推动光学字符识别技术向OCR-2.0迈进。
AI图像检测识别#深度学习
Bonding W Geimini
bonding_w_geimini是一个基于Streamlit框架开发的图像处理应用,它允许用户上传图片,通过Gemini API进行物体检测,并在图片上直接绘制出物体的边界框。
AI图像检测识别#物体检测
Labelu Kit
labelU-Kit 是一个开源的前端标注组件库,提供图片、视频和音频的标注功能,支持2D框、点、线、多边形、立体框等多种标注方式。
AI图像检测识别#机器学习
Labelu
优质新品
LabelU是一个开源的数据标注工具,适用于需要对图像、视频、音频等数据进行高效标注的场景,以提升机器学习模型的性能和质量。
AI图像检测识别#机器学习
SAM Graph
SAM-guided Graph Cut for 3D Instance Segmentation是一种利用3D几何和多视图图像信息进行3D实例分割的深度学习方法。
AI图像检测识别#深度学习