Emu
Emu适用于需要提高图像生成模型美感的场景,可以用于各种图像生成任务。
总访问量: 1,186,988
占比最多地区: US(32.03%)
936
简介
Emu是一个用于提高图像生成模型美感的质量调整工具。它可以通过有限的高质量图像进行微调,从而显著提高生成质量。Emu在1.1亿个图像-文本对上进行了预训练,并使用了几千个精心挑选的高质量图像进行了微调。与仅进行预训练的模型相比,Emu的胜率达到了82.9%。与最先进的SDXLv1.0相比,Emu在视觉吸引力方面的偏好率分别为68.4%和71.3%。Emu还可以用于其他架构,包括像素扩散和掩蔽生成变压器模型。
截图
产品特色
使用有限的高质量图像进行微调,提高生成质量
可以用于其他架构,包括像素扩散和掩蔽生成变压器模型
在视觉吸引力方面的偏好率分别为68.4%和71.3%
流量来源
直接访问34.72%外链引荐50.02%邮件0.07%
自然搜索10.24%社交媒体4.69%展示广告0.26%
最新流量情况
月访问量
1900.01k
平均访问时长
86.52
每次访问页数
1.58
跳出率
67.95%
总流量趋势图
地理流量分布情况
美国
32.03%
印度
10.42%
中国
3.66%
英国
3.20%
德国
3.12%
地理流量分布全球图
替代品
Hallo2
Hallo2是一种基于潜在扩散生成模型的人像图像动画技术,通过音频驱动生成高分辨率、长时的视频。
AI图像生成#音频驱动
Comfygen
ComfyGen 是一个专注于文本到图像生成的自适应工作流系统,它通过学习用户提示来自动化并定制有效的工作流。
AI图像生成#自适应工作流
Comfyui Fluxtapoz
ComfyUI-Fluxtapoz是一个为Flux在ComfyUI中编辑图像而设计的节点集合。
AI图像生成#Flux
Toy Box Flux
Toy Box Flux是一个基于AI生成图像训练的3D渲染模型,它结合了现有的3D LoRA模型和Coloring Book Flux LoRA的权重,形成了独特的风格。
AI图像生成#3D渲染
Disenvisioner
DisEnvisioner是一种先进的图像生成技术,它通过分离和增强主题特征来生成定制化的图像,无需繁琐的调整或依赖多张参考图片。
AI图像生成#定制化
RF Inversion
RF-Inversion是一个专注于图像生成和编辑的技术,它通过随机微分方程(SDE)来实现图像的反转和编辑。
AI图像生成#语义编辑
Animate X
Animate-X是一个基于LDM的通用动画框架,用于各种角色类型(统称为X),包括人物拟态角色。
AI图像生成#图像动画
Meissonic
Meissonic是一个非自回归的掩码图像建模文本到图像合成模型,能够生成高分辨率的图像。
AI图像生成#高分辨率
Cogview3 Plus 3B
优质新品
由清华大学团队开发的文本到图像生成模型,开源,在图像生成领域有广泛应用前景,有高分辨率输出等优点。
AI图像生成#图像生成