# 文本到图像
文本到图像
Blip 3o
Blip 3o 是一个基于 Hugging Face 平台的应用程序,利用先进的生成模型从文本生成图像,或对现有图像进行分析和回答。
图片生成#文本到图像开源
384
Cogview4 6B
CogView4-6B 是由清华大学知识工程组开发的文本到图像生成模型。
图片生成#深度学习开源
2,352
Cogview4
优质新品
CogView4 是由清华大学开发的先进文本到图像生成模型,基于扩散模型技术,能够根据文本描述生成高质量图像。
图片生成#高分辨率开源
1,932
Diffsplat
DiffSplat 是一种创新的 3D 生成技术,能够从文本提示和单视图图像快速生成 3D 高斯点云。
3D建模#高斯点云开源
624
Fashion Hut Modeling LoRA
Fashion-Hut-Modeling-LoRA是一个基于Diffusion技术的文本到图像生成模型,主要用于生成时尚模特的高质量图像。
图片生成#Diffusion开源
1,908
Flux Midjourney Mix2 LoRA
Flux-Midjourney-Mix2-LoRA 是一款基于深度学习的文本到图像生成模型,旨在通过自然语言描述生成高质量的图像。
图片生成#深度学习开源
1,152
Neuralsvg
NeuralSVG是一种用于从文本提示生成矢量图形的隐式神经表示方法。
AI设计工具#文本到图像开源
564
Vmix
VMix是一种用于提升文本到图像扩散模型美学质量的技术,通过创新的条件控制方法——价值混合交叉注意力,系统性地增强图像的美学表现。
图片生成#扩散模型开源
516
Story Adapter
Story-Adapter是一个无需训练的迭代框架,专为长篇故事可视化设计。
图片生成#图像生成开源
3,096
Dynamiccontrol
DynamicControl是一个用于提升文本到图像扩散模型控制力的框架。
AI模型#扩散模型开源
360
Luminabrush
LuminaBrush是一个交互式工具,旨在绘制图像上的照明效果。
AI设计工具#照明效果开源
636
Flux Condensation
fofr/flux-condensation是一个基于文本生成图像的AI模型,使用Diffusers库和LoRAs技术,能够根据用户提供的文本提示生成相应的图像。
图片生成#AI模型开源
972
Sana 600M 512px
Sana是一个由NVIDIA开发的文本到图像的生成框架,能够高效生成高达4096×4096分辨率的图像。
图片生成#高分辨率开源
1,296
Grok Aurora
Aurora是Grok推出的新一代自回归图像生成模型,它通过训练数十亿的互联网样本,具备了深刻的世界理解能力。
图片生成#AI
444
Sana 600M 1024px
Sana是一个由NVIDIA开发的文本到图像生成框架,能够高效生成高达4096×4096分辨率的图像。
图片生成#高分辨率开源
528
Shou Xin
shou_xin是一个基于文本到图像的生成模型,它能够根据用户提供的文本提示生成具有手訫风格的铅笔素描图像。
图片生成#铅笔素描开源
1,872
Sana 1600M 1024px MultiLing
Sana是一个由NVIDIA开发的文本到图像的框架,能够高效生成高达4096×4096分辨率的图像。
图片生成#高分辨率开源
600
Bylo.ai
Bylo.ai是一款高级的AI图像生成器,能够将文本描述快速转换为高质量的图像。
图片生成#文本到图像
2,172
Awportraitcn
AWPortraitCN是一个基于FLUX.1-dev开发的文本到图像生成模型,专门针对中国人的外貌和审美进行训练。
图片生成#肖像生成开源
732
Sana 1600M 512px MultiLing
Sana是一个由NVIDIA开发的文本到图像的框架,能够高效生成高达4096×4096分辨率的图像。
图片生成#高分辨率开源
264
Sana 1600M 1024px
Sana是一个由NVIDIA开发的文本到图像生成框架,能够高效生成高达4096×4096分辨率的高清晰度、高文本-图像一致性的图像,并且速度极快,可以在笔记本电脑GPU上部署。
图片生成#高分辨率开源
492
Sana 1600M 512px
Sana是一个由NVIDIA开发的文本到图像的生成框架,能够高效生成高达4096×4096分辨率的图像。
图片生成#高分辨率开源
516
MV Adapter
MV-Adapter是一种基于适配器的多视图图像生成解决方案,它能够在不改变原有网络结构或特征空间的前提下,增强预训练的文本到图像(T2I)模型及其衍生模型。
图片生成#适配器开源
1,476
Text To Pose
text-to-pose是一个研究项目,旨在通过文本描述生成人物姿态,并利用这些姿态生成图像。
图片生成#姿态估计开源
684
Sana
Sana是一个文本到图像的框架,能够高效生成高达4096×4096分辨率的图像。
图片生成#文本到图像开源
768
Stable Diffusion 3.5 ControlNets
Stable Diffusion 3.5 ControlNets是由Stability AI提供的文本到图像的AI模型,支持多种控制网络(ControlNets),如Canny边缘检测、深度图和高保真上采样等。
图片生成#文本到图像开源
504
FLUX.1 Dev IP Adapter
FLUX.1-dev-IP-Adapter是一个基于FLUX.1-dev模型的IP-Adapter,由InstantX Team研发。
#文本到图像开源
1,272
FLUX.1 Tools
国外精选
FLUX.1 Tools是Black Forest Labs推出的一套模型工具,旨在为基于文本的图像生成模型FLUX.1增加控制和可操作性,使得对真实和生成的图像进行修改和再创造成为可能。
#文本到图像
1,512
Edify Image
Edify Image是NVIDIA推出的一款图像生成模型,它能够生成具有像素级精确度的逼真图像内容。
图片生成#像素空间扩散模型
708
Seededit
SeedEdit是Doubao Team推出的大型扩散模型,用于根据任何文本提示修订图像。
图片编辑#扩散模型
8,400
Regional Prompting FLUX
Regional-Prompting-FLUX是一种训练无关的区域提示扩散变换器模型,它能够在无需训练的情况下,为扩散变换器(如FLUX)提供细粒度的组合文本到图像生成能力。
图片生成#AI开源
744
Stable Diffusion 3.5 Medium 2.6B
Stable Diffusion 3.5 Medium 是由 Stability AI 提供的一款基于人工智能的图像生成模型,它能够根据文本描述生成高质量的图像。
图片生成#图像生成开源
1,944
Stable Diffusion 3.5 Medium
Stable Diffusion 3.5 Medium是一个基于文本到图像的生成模型,由Stability AI开发,具有改进的图像质量、排版、复杂提示理解和资源效率。
图片生成#生成模型开源
948
Flux.1 Lite
Flux.1 Lite是一个由Freepik发布的8B参数的文本到图像生成模型,它是从FLUX.1-dev模型中提取出来的。
图片生成#AI生成开源
540
Stable Diffusion 3.5 Large Turbo
Stable Diffusion 3.5 Large Turbo 是一个基于文本生成图像的多模态扩散变换器(MMDiT)模型,采用了对抗性扩散蒸馏(ADD)技术,提高了图像质量、排版、复杂提示理解和资源效率,特别注重减少推理步骤。
图片生成#生成模型开源
1,404
Stable Diffusion 3.5 Large
Stable Diffusion 3.5 Large 是一个基于文本生成图像的多模态扩散变换器(MMDiT)模型,由 Stability AI 开发。
图片生成#图像生成开源
1,224
Sd3.5
Stable Diffusion 3.5是一个用于简单推理的轻量级模型,它包含了文本编码器、VAE解码器和核心MM-DiT技术。
图片生成#AI开源
1,248
SD3.5 LoRA Linear Red Light
SD3.5-LoRA-Linear-Red-Light是一个基于文本到图像生成的AI模型,通过使用LoRA(Low-Rank Adaptation)技术,该模型能够根据用户提供的文本提示生成高质量的图像。
图片生成#图像生成开源
1,272
FLUX.1 Dev LoRA Text Poster
FLUX.1-dev-LoRA-Text-Poster是由Shakker-Labs开发的文本到图像生成模型,专门用于艺术文本海报的生成。
图片生成#艺术创作开源
420
Comfygen
ComfyGen 是一个专注于文本到图像生成的自适应工作流系统,它通过学习用户提示来自动化并定制有效的工作流。
AI图像生成#自适应工作流开源
1,068