DL3DV 10K : 大规模实景数据集,用于深度学习三维视觉研究

DL3DV 10K

简介 :

DL3DV-10K是一个包含超过10000个高质量视频的大规模实景数据集,每个视频都经过人工标注场景关键点和复杂程度,并提供相机姿态、NeRF估计深度、点云和3D网格等。该数据集可用于通用NeRF研究、场景一致性跟踪、视觉语言模型等计算机视觉研究。

需求人群 :

["通用NeRF模型研究","场景级一致性跟踪","视觉语言模型研究","三维重建","虚拟现实","增强现实","自动驾驶视觉感知"]

总访问量： 359

占比最多地区： US(100.00%)

本站浏览量： 64.3K

使用场景

使用DL3DV-10K数据集优化NeRF模型表现

基于DL3DV-10K训练视觉语言模型

使用DL3DV-10K中的视角和场景信息进行SLAM系统开发

产品特色

提供超过1万个高质量视频

人工标注场景关键点和环境复杂度

配套相机姿态、NeRF深度等数据

支持NeRF、视觉语言模型等前沿算法研究

精选AI产品推荐

智启未来，您的人工智能解决方案智库

简体中文

直接访问	55.00%	外链引荐	23.40%	邮件	0.04%
自然搜索	10.13%	社交媒体	10.59%	展示广告	0.85%

月访问量	1304
美国	100.00%