Llamagen : 自回归模型在可扩展图像生成领域的新突破

Llamagen

简介 :

LlamaGen是一个新的图像生成模型家族，它将大型语言模型的原始下一个token预测范式应用于视觉生成领域。该模型通过适当的扩展，无需对视觉信号的归纳偏差即可实现最先进的图像生成性能。LlamaGen重新审视了图像分词器的设计空间、图像生成模型的可扩展性属性以及它们的训练数据质量。

需求人群 :

LlamaGen的目标受众是图像生成领域的研究人员和开发者，特别是那些对利用自回归模型进行高质量图像合成感兴趣的人。它适合需要生成高质量图像的AI艺术家、游戏开发者、电影制作者以及任何需要图像生成技术的行业。

总访问量： 474.6M

占比最多地区： US(19.34%)

本站浏览量： 79.5K

使用场景

使用LlamaGen生成特定风格的艺术作品。

在游戏开发中，使用LlamaGen快速生成游戏内环境和角色的图像。

电影制作中，利用LlamaGen创建逼真的背景和场景。

产品特色

提供两种图像分词器，下采样比率分别为16和8。

发布七个类条件生成模型，参数从100M到3B不等。

提供两个文本条件生成模型，参数为700M。

支持在线演示，运行预训练模型。

支持LLM服务框架，可实现300% - 400%的速度提升。

类条件图像生成在ImageNet上的应用。

文本条件图像生成，使用LAION COCO数据集和内部数据。

使用教程

访问LlamaGen的GitHub页面并克隆或下载代码。

阅读并遵循GETTING_STARTED.md文件中的安装指南。

下载预训练模型并将其放置在指定的文件夹中。

运行提供的脚本以生成图像，查看生成结果。

根据需要调整参数和设置以优化生成的图像。

精选AI产品推荐

智启未来，您的人工智能解决方案智库

简体中文

直接访问	51.61%	外链引荐	33.46%	邮件	0.04%
自然搜索	12.58%	社交媒体	2.19%	展示广告	0.11%