简介
StableDelight是一个先进的模型,专注于从纹理表面去除镜面反射。它基于StableNormal的成功,后者专注于提高单目法线估计的稳定性。StableDelight通过应用这一概念来解决去除反射的挑战性任务。训练数据包括Hypersim、Lumos以及来自TSHRNet的各种镜面高光去除数据集。此外,我们在扩散训练过程中整合了多尺度SSIM损失和随机条件尺度技术,以提高一步扩散预测的清晰度。
截图

产品特色
去除镜面反射:从纹理表面去除镜面反射,揭示隐藏的纹理细节。
多尺度SSIM损失:在扩散训练过程中使用,提高预测的清晰度。
随机条件尺度技术:增强模型在不同条件下的适应性和预测精度。
基于StableNormal:继承了StableNormal在单目法线估计中的稳定性优势。
支持Torch Hub Loader:方便地加载和应用模型。
提供Gradio界面:为用户提供更好的交互体验。
使用教程
1. 打开终端或命令提示符。
2. 使用以下命令安装StableDelight:`pip install stable-delight`。
3. 导入所需的库:`import torch, from PIL import Image`。
4. 加载图像:`input_image = Image.open("path/to/your/image.jpg")`。
5. 创建预测器实例:`predictor = torch.hub.load("Stable-X/StableDelight", "StableDelight_turbo", trust_repo=True)`。
6. 将模型应用于图像:`delight_image = predictor(input_image)`。
7. 保存或显示结果:`delight_image.save("output/delight.png")`。
8. (可选)使用Gradio界面:运行`python app.py`启动Gradio界面。
流量来源
直接访问 | 51.61% | 外链引荐 | 33.46% | 邮件 | 0.04% |
自然搜索 | 12.58% | 社交媒体 | 2.19% | 展示广告 | 0.11% |
最新流量情况
月访问量
4.92m
平均访问时长
393.01
每次访问页数
6.11
跳出率
36.20%
总流量趋势图
地理流量分布情况
美国
19.34%
中国
13.25%
印度
9.32%
俄罗斯
4.28%
德国
3.63%
地理流量分布全球图
同类开源产品

Facefusion Labs
FaceFusion Labs 是一个专注于面部操作的领先平台,它利用先进的技术来实现面部特征的融合和操作。
AI图像编辑#面部识别

Facepoke
FacePoke是一款人工智能驱动的实时头部和面部变换工具,它允许用户通过直观的拖放界面操纵面部特征,为肖像注入生命力,实现逼真的动画和表情。
AI图像编辑#面部编辑

图改改
中文精选
图改改是一个在线AI图片文字编辑器,它通过人工智能技术,让用户能够轻松地在图片上修改、添加或删除文字。
AI图像编辑#AI技术

Pic Pic AI
优质新品
Pic Pic AI编辑器是一个强大的AI图片编辑工具,它提供了多种功能,如照片增强、背景去除、物体移除等,使用户能够轻松地对照片进行专业级别的编辑。
AI图像编辑#照片编辑

Photo4you
优质新品
photo4you是一个基于人工智能技术的在线证件照制作网站,用户无需下载或安装任何软件即可轻松创建证件照片。
AI图像编辑#AI

Iphone Photo [FLUX] (iPhone Realism) V1 Final
iPhone Photo [FLUX] 是一个基于LoRA技术的AI模型,旨在增强图像的真实感,特别是在模仿iPhone照片效果方面表现出色。
AI图像增强#图像增强

Stager AI
Stager AI是一个为房地产行业设计的虚拟家居布置和图片编辑器,利用人工智能技术帮助用户快速、轻松地提升房产图片的吸引力,从而提高房产的在线展示效果和销售转化率。
AI图像编辑#图片编辑

Depthflow
DepthFlow是一个高度可定制的视差着色器,用于动画化您的图像。
AI图像编辑#图像动画

Flux.1 Dev Controlnet Upscaler
Flux.1-dev Controlnet Upscaler 是一个基于Hugging Face平台的图像放大模型,它使用先进的深度学习技术来提高图像的分辨率,同时保持图像质量。
AI图像增强#深度学习
替代品

Facefusion Labs
FaceFusion Labs 是一个专注于面部操作的领先平台,它利用先进的技术来实现面部特征的融合和操作。
AI图像编辑#面部识别

Depthflow
DepthFlow是一个高度可定制的视差着色器,用于动画化您的图像。
AI图像编辑#图像动画

Flux.1 Dev Controlnet Upscaler
Flux.1-dev Controlnet Upscaler 是一个基于Hugging Face平台的图像放大模型,它使用先进的深度学习技术来提高图像的分辨率,同时保持图像质量。
AI图像增强#深度学习

Facefusion
FaceFusion是一个行业领先的面部操作平台,专注于面部交换、唇形同步和深度操作技术。
AI图像编辑#面部交换

Stabledelight
StableDelight是一个先进的模型,专注于从纹理表面去除镜面反射。
AI图像增强#计算机视觉

Colorful Diffuse Intrinsic Image Decomposition
Colorful Diffuse Intrinsic Image Decomposition 是一种图像处理技术,它能够将野外拍摄的照片分解为反照率、漫反射阴影和非漫反射残留部分。
AI图像编辑#计算机视觉

Opencv Contrib
opencv_contrib是OpenCV的额外模块库,用于开发和测试新的图像处理功能。
AI图像编辑#图像处理

Finegrain Object Cutter
优质新品
finegrain-object-cutter 是一个基于Hugging Face Spaces平台的图像编辑工具,它利用先进的机器学习技术来实现对图像中对象的细粒度切割。
AI图像编辑#机器学习

Rapidlayoutrecover
RapidLayoutRecover是一个专门针对文档类图像的版面还原工具,它能够整合版面分析、文字识别、表格识别和公式识别的结果,还原文档的原始版面布局信息。
AI图像编辑#版面还原
精选AI产品推荐

Nocode
中文精选
NoCode 是一款无需编程经验的平台,允许用户通过自然语言描述创意并快速生成应用,旨在降低开发门槛,让更多人能实现他们的创意。
开发平台#应用开发
912

Listenhub
优质新品
ListenHub 是一款轻量级的 AI 播客生成工具,支持中文和英语,基于前沿 AI 技术,能够快速生成用户感兴趣的播客内容。
音频生成#AI
348

Lovart
国外精选
Lovart 是一款革命性的 AI 设计代理,能够将创意提示转化为艺术作品,支持从故事板到品牌视觉的多种设计需求。
AI设计工具#创意工具
1,128

Fastvlm
FastVLM 是一种高效的视觉编码模型,专为视觉语言模型设计。
AI模型#图像处理开源
564

Smart PDFs
国外精选
Smart PDFs 是一个在线工具,利用 AI 技术快速分析 PDF 文档,并生成简明扼要的总结。
文章摘要#AI
984

Keysync
KeySync 是一个针对高分辨率视频的无泄漏唇同步框架。
视频编辑#视频处理开源
480

Anyvoice
AnyVoice是一款领先的AI声音生成器,采用先进的深度学习模型,将文本转换为与人类无法区分的自然语音。
音频生成#文本转语音
26.38k

Liblibai
中文精选
LiblibAI是一个中国领先的AI创作平台,提供强大的AI创作能力,帮助创作者实现创意。
AI模型#图像生成
344.42k