PIXART LCM : 快速可控的图像生成与潜在一致性模型

PIXART LCM

AI图像生成 AI模型 #图像生成 #潜在一致性模型 #ControlNet #高质量图像 #开源模型普通产品开源

简介 :

PIXART LCM是一个文本到图像合成框架，将潜在一致性模型（LCM）和ControlNet集成到先进的PIXART-α模型中。PIXART LCM以其能够通过高效的训练过程生成1024px分辨率的高质量图像而闻名。在PIXART-δ中集成LCM显著加快了推理速度，使得仅需2-4步即可生成高质量图像。特别值得注意的是，PIXART-δ实现了在0.5秒内生成1024x1024像素图像的突破，比PIXART-α改进了7倍。此外，PIXART-δ经过精心设计，可在单日内在32GB V100GPU上进行高效训练。具有8位推理能力的PIXART-δ可以在8GB GPU内存约束下合成1024px图像，极大地增强了其可用性和可访问性。此外，引入类似于ControlNet的模块可以对文本到图像扩散模型进行精细控制。我们引入了一种新颖的ControlNet-Transformer架构，专门为Transformers量身定制，实现了显式可控性和高质量图像生成。作为一种最先进的开源图像生成模型，PIXART-δ为稳定扩散模型家族提供了一个有前途的选择，为文本到图像合成做出了重大贡献。

需求人群 :

用于文本到图像合成，特别适用于需要快速生成高质量图像的场景。

总访问量： 29.7M

占比最多地区： US(17.94%)

本站浏览量： 56.3K

使用场景

用于生成艺术图像的在线图像合成平台

用于电子商务网站的自动生成产品图片

用于科学研究中生成实验数据可视化图像

产品特色

集成潜在一致性模型（LCM）和ControlNet

高质量图像生成