SAM Graph
该技术适用于需要进行3D实例分割的领域,如自动驾驶、机器人导航、增强现实等,尤其适合那些需要处理复杂场景和缺乏高多样性3D标注数据的应用场景。
总访问量: 36,028
占比最多地区: CN(24.61%)
516
简介
SAM-guided Graph Cut for 3D Instance Segmentation是一种利用3D几何和多视图图像信息进行3D实例分割的深度学习方法。该方法通过3D到2D查询框架,有效利用2D分割模型进行3D实例分割,通过图割问题构建超点图,并通过图神经网络训练,实现对不同类型场景的鲁棒分割性能。
截图
产品特色
利用3D几何和多视图图像信息进行实例分割
3D到2D查询框架,提高场景泛化能力
图割问题构建,优化分割结果
基于2D分割模型的图神经网络训练
在ScanNet, ScanNet++和KITTI-360数据集上验证性能
实现不同类型场景的鲁棒分割
使用教程
步骤1:预处理3D点云数据,提取场景中的超点。
步骤2:使用2D分割模型对多视图图像进行分割,获取节点特征。
步骤3:根据多视图分割结果计算边权重,构建超点图。
步骤4:训练图神经网络,使用伪3D标签。
步骤5:利用图割算法处理超点图,实现3D实例分割。
步骤6:在不同数据集上验证模型性能,调整参数以适应不同场景。
流量来源
直接访问42.39%外链引荐41.77%邮件0.10%
自然搜索11.47%社交媒体3.76%展示广告0.47%
最新流量情况
月访问量
33.66k
平均访问时长
31.55
每次访问页数
1.19
跳出率
57.06%
总流量趋势图
地理流量分布情况
中国
24.61%
韩国
21.72%
美国
11.06%
俄罗斯
7.73%
中国台湾
5.65%
地理流量分布全球图
同类开源产品
Esearch
eSearch 是一款基于Electron开发的跨平台屏幕搜索和截屏软件,支持Linux、Windows和Mac系统。
AI图像检测识别#OCR
Image Describer
Image Describer图像描述生成器是一款利用人工智能技术,通过上传图像并根据用户需求输出图像描述的工具。
AI图像检测识别#文本转语音
Makerlab
中文精选
MakerLab是一个在线平台,提供多种3D模型设计工具,包括花瓶生成器、标牌定制器等,用户可以根据自己的需求快速轻松地创建个性化的3D模型。
AI 3D工具#设计工具
Viewly
Viewly是一款强大的AI图片识别应用,它能够识别图片中的内容,并通过AI技术进行作诗和翻译成多国语言。
AI图像检测识别#图像识别
Pimeyes
PimEyes是一个利用面部识别技术提供反向图片搜索服务的网站,用户可以通过上传照片来查找互联网上与该照片相似的图片或个人信息。
AI图像检测识别#反向图片搜索
Flex3d
Flex3D是一个两阶段流程,能够从单张图片或文本提示生成高质量的3D资产。
AI 3D工具#计算机视觉
YOLO11
Ultralytics YOLO11是基于之前YOLO系列模型的进一步发展,引入了新特性和改进,以提高性能和灵活性。
AI图像检测识别#机器学习
Revisit Anything
Revisit Anything 是一个视觉位置识别系统,通过图像片段检索技术,能够识别和匹配不同图像中的位置。
AI图像检测识别#图像检索
Joy Caption Alpha One
Joy Caption Alpha One 是一款基于人工智能的图像描述生成器,能够将图片内容转化为文字描述。
AI图像检测识别#图像识别
替代品
Esearch
eSearch 是一款基于Electron开发的跨平台屏幕搜索和截屏软件,支持Linux、Windows和Mac系统。
AI图像检测识别#OCR
Flex3d
Flex3D是一个两阶段流程,能够从单张图片或文本提示生成高质量的3D资产。
AI 3D工具#计算机视觉
Revisit Anything
Revisit Anything 是一个视觉位置识别系统,通过图像片段检索技术,能够识别和匹配不同图像中的位置。
AI图像检测识别#图像检索
Joy Caption Alpha One
Joy Caption Alpha One 是一款基于人工智能的图像描述生成器,能够将图片内容转化为文字描述。
AI图像检测识别#图像识别
Open Source Computer Vision Library
OpenCV是一个跨平台的开源计算机视觉和机器学习软件库,它提供了一系列编程功能,包括但不限于图像处理、视频分析、特征检测、机器学习等。
AI图像检测识别#机器学习
GOT OCR2.0
GOT-OCR2.0是一个开源的OCR模型,旨在通过一个统一的端到端模型推动光学字符识别技术向OCR-2.0迈进。
AI图像检测识别#深度学习
Bonding W Geimini
bonding_w_geimini是一个基于Streamlit框架开发的图像处理应用,它允许用户上传图片,通过Gemini API进行物体检测,并在图片上直接绘制出物体的边界框。
AI图像检测识别#物体检测
Labelu Kit
labelU-Kit 是一个开源的前端标注组件库,提供图片、视频和音频的标注功能,支持2D框、点、线、多边形、立体框等多种标注方式。
AI图像检测识别#机器学习
Labelu
优质新品
LabelU是一个开源的数据标注工具,适用于需要对图像、视频、音频等数据进行高效标注的场景,以提升机器学习模型的性能和质量。
AI图像检测识别#机器学习