# 图像合成
图像合成
Dynamiccontrol
DynamicControl是一个用于提升文本到图像扩散模型控制力的框架。
AI模型#扩散模型开源
360
Synthesys
Synthesys是一个AI内容生成平台,提供AI视频、AI语音和AI图像生成服务。
视频生成#AI语音
1,536
Sana 600M 1024px
Sana是一个由NVIDIA开发的文本到图像生成框架,能够高效生成高达4096×4096分辨率的图像。
图片生成#高分辨率开源
528
Sana 1600M 1024px MultiLing
Sana是一个由NVIDIA开发的文本到图像的框架,能够高效生成高达4096×4096分辨率的图像。
图片生成#高分辨率开源
600
Sana 1.6B
Sana-1.6B是一个高效的高分辨率图像合成模型,它基于线性扩散变换器技术,能够生成高质量的图像。
图片生成#AI
504
Sana
Sana是一个文本到图像的框架,能够高效生成高达4096×4096分辨率的图像。
图片生成#文本到图像开源
768
Onediffusion
OneDiffusion是一个多功能、大规模的扩散模型,它能够无缝支持双向图像合成和理解,覆盖多种任务。
图片生成#图像合成开源
516
Any Image Anywhere
Any Image Anywhere 是一个基于人工智能的图像处理工具,它允许用户通过简单的提示将输入图像放置到不同的上下文中,例如将能量饮料的商标放置在产品照片上。
#AI编辑
768
Magicface
MagicFace是一种无需训练即可实现个性化人像合成的技术,它能够根据给定的多个概念生成高保真度的人像图像。
AI图像生成#个性化定制开源
648
Dipir
DiPIR是多伦多AI实验室与NVIDIA Research共同研发的一种基于物理的方法,它通过从单张图片中恢复场景照明,使得虚拟物体能够逼真地插入到室内外场景中。
AI图像生成#虚拟物体
732
Ultrapixel
UltraPixel是一种先进的超高清图像合成技术,旨在推动图像分辨率达到新的高度。
AI图像生成#图像合成开源
7,416
Jector
Jector是一个AI创作工具,专注于为产品摄影提供高质量的背景生成服务。
图片生成#产品摄影
948
Tryondiffusion
优质新品
TryOnDiffusion是一种创新的图像合成技术,它通过两个UNets(Parallel-UNet)的结合,实现了在单一网络中同时保持服装细节和适应显著的身体姿势及形状变化。
AI图像生成#服装试穿开源
1,296
Hidiffusion
优质新品
HiDiffusion是一个预训练扩散模型,通过仅添加一行代码即可提高扩散模型的分辨率和速度。
AI图像生成#人工智能开源
1,920
Hyper SD
优质新品
Hyper-SD是一个创新的图像合成框架,它通过轨迹分割一致性模型和低步数推理的优势,实现了高效的图像合成。
AI图像生成#人工智能开源
2,652
Magicclothing
MagicClothing是一种基于潜在扩散模型(LDM)的新型网络架构,专门用于服装驱动的图像合成任务。
AI图像生成#图像合成开源
4,908
Masked Diffusion Transformer (MDT)
MDT通过引入掩码潜在模型方案来显式增强扩散概率模型(DPMs)在图像中对象部分之间关系学习的能力。
AI图像生成#图像合成开源
912
Trajectory Consistency Distillation (TCD)
TCD是一种用于文本到图像合成的一致性蒸馏技术,它通过轨迹一致性函数(TCF)和策略性随机采样(SSS)来减少合成过程中的错误。
AI图像生成#一致性蒸馏开源
1,596
Orthogonal Finetuning (OFT)
Controlling Text-to-Image Diffusion研究了如何有效引导或控制强大的文本到图像生成模型进行各种下游任务。
图片生成#图像合成
1,236
Instantid
InstantID是一种基于强大扩散模型的解决方案,能够在各种风格下使用单张面部图像进行图像个性化处理,同时确保高保真度。
AI图像生成#身份保留开源
26.94k
Score Distillation Sampling
Score Distillation Sampling(SDS)是一种新近但已经广泛流行的方法,依赖于图像扩散模型来控制使用文本提示的优化问题。
AI图像生成#优化问题开源
1,212
Reconfusion
ReconFusion是一种3D重建方法,利用扩散先验在只有少量照片的情况下重建真实世界场景。
AI图像生成#扩散先验开源
924
SDXL TURBO ONLINE
SDXL Turbo是一款基于Adversarial Diffusion Distillation(ADD)技术的文本生成图像模型,能够快速生成高质量的图像。
图片生成#文本生成
780
GAIA
GAIA旨在从语音和单个肖像图像合成自然的对话视频。
AI视频生成#语音驱动开源
1,584
Luosiallen LCM
luosiallen/latent-consistency-model 是一个用于合成高分辨率图像的模型。
AI图像生成#高分辨率
8,868
Deep Floyd
Deep floyd是一个开源的文本到图像模型,具有高度的写实性和语言理解能力。
AI图像生成#图像合成开源
504
Runway Gen2
Gen-2是一款多模态人工智能系统,可以根据文字、图片或视频剪辑生成新颖的视频。
AI视频生成#人工智能
50.17k