Emu Edit
Emu Edit适用于各种图像编辑需求,包括但不限于区域编辑、风格修改、对象添加和移除、图像分割等。
总访问量: 9,022
占比最多地区: IN(49.34%)
3,456
简介
Emu Edit是一款多任务图像编辑模型,通过识别和生成任务完成精准图像编辑,并在此领域内取得了最新的技术突破。Emu Edit的架构针对多任务学习进行了优化,并在众多任务上进行训练,包括基于区域的编辑、自由形式的编辑以及检测和分割等计算机视觉任务。除此之外,为了更有效地处理这多种任务,我们引入了学习到的任务嵌入概念,用于指导生成过程以正确执行编辑指令。我们的模型经过多任务训练和使用学习到的任务嵌入都能显著提升准确执行编辑指令的能力。 Emu Edit还支持对未见任务的快速适应,通过任务倒转实现少样本学习。在这个过程中,我们保持模型权重不变,仅更新任务嵌入来适应新任务。我们的实验证明,Emu Edit能够迅速适应新任务,如超分辨率、轮廓检测等。这使得在标注样本有限或计算预算有限的情况下,使用Emu Edit进行任务倒转特别有优势。 为了支持对基于指令的图像编辑模型的严格且有根据的评估,我们还收集并公开发布了一个新的基准数据集,其中包含七种不同的图像编辑任务:背景修改(background)、综合图像变化(global)、风格修改(style)、对象移除(remove)、对象添加(add)、局部修改(local)以及颜色/纹理修改(texture)。此外,为了与Emu Edit进行正确比较,我们还分享了Emu Edit在数据集上的生成结果。 Emu Edit 2023 Meta保留所有版权
截图
产品特色
区域编辑
自由形式编辑
检测和分割
超分辨率
轮廓检测
背景修改
风格修改
对象移除
对象添加
局部修改
颜色/纹理修改
流量来源
直接访问27.00%外链引荐35.43%邮件0.16%
自然搜索32.54%社交媒体3.57%展示广告1.08%
最新流量情况
月访问量
441
平均访问时长
12.70
每次访问页数
2.28
跳出率
0.27%
总流量趋势图
地理流量分布情况
印度
49.34%
法国
28.46%
埃及
22.20%
地理流量分布全球图
替代品
Hallo2
Hallo2是一种基于潜在扩散生成模型的人像图像动画技术,通过音频驱动生成高分辨率、长时的视频。
AI图像生成#音频驱动
Comfygen
ComfyGen 是一个专注于文本到图像生成的自适应工作流系统,它通过学习用户提示来自动化并定制有效的工作流。
AI图像生成#自适应工作流
Comfyui Fluxtapoz
ComfyUI-Fluxtapoz是一个为Flux在ComfyUI中编辑图像而设计的节点集合。
AI图像生成#Flux
Facefusion Labs
FaceFusion Labs 是一个专注于面部操作的领先平台,它利用先进的技术来实现面部特征的融合和操作。
AI图像编辑#面部识别
Toy Box Flux
Toy Box Flux是一个基于AI生成图像训练的3D渲染模型,它结合了现有的3D LoRA模型和Coloring Book Flux LoRA的权重,形成了独特的风格。
AI图像生成#3D渲染
Disenvisioner
DisEnvisioner是一种先进的图像生成技术,它通过分离和增强主题特征来生成定制化的图像,无需繁琐的调整或依赖多张参考图片。
AI图像生成#定制化
RF Inversion
RF-Inversion是一个专注于图像生成和编辑的技术,它通过随机微分方程(SDE)来实现图像的反转和编辑。
AI图像生成#语义编辑
Animate X
Animate-X是一个基于LDM的通用动画框架,用于各种角色类型(统称为X),包括人物拟态角色。
AI图像生成#图像动画
Meissonic
Meissonic是一个非自回归的掩码图像建模文本到图像合成模型,能够生成高分辨率的图像。
AI图像生成#高分辨率