Depth Anything
简介 :
Depth Anything是一个高度实用的解决方案,用于稳健的单目深度估计。我们旨在构建一个简单而强大的基础模型,处理任何情况下的任何图像,而不追求新颖的技术模块。为此,我们通过设计数据引擎来扩大数据集,收集并自动注释大规模未标记数据(约62M),从而显着扩大数据覆盖范围,从而能够减少泛化误差。我们研究了两种简单而有效的策略,使数据扩展变得有前途。首先,通过利用数据增强工具创建更具挑战性的优化目标。它迫使模型积极寻求额外的视觉知识并获得强大的表示。其次,开发了辅助监督,以强制模型从预训练编码器中继承丰富的语义先验。我们对其零-shot能力进行了广泛评估,包括六个公共数据集和随机拍摄的照片。它展现出令人印象深刻的泛化能力。此外,通过使用来自NYUv2和KITTI的度量深度信息对其进行微调,我们建立了新的SOTAs。我们更好的深度模型也导致更好的深度条件ControlNet。我们的模型发布在https://github.com/LiheYoung/Depth-Anything。
需求人群 :
适用于图像处理、深度估计和计算机视觉领域。
总访问量: 4.9K
占比最多地区: US(34.58%)
本站浏览量 : 176.9K
使用场景
用于自动驾驶系统中的单目深度估计
应用于虚拟现实技术中的图像处理
在无人机领域中用于地形重建
产品特色
稳健的单目深度估计
数据集扩大和自动注释
数据增强工具
辅助监督
零-shot能力评估
度量深度信息微调
AIbase
智启未来,您的人工智能解决方案智库
简体中文