Llamagen
LlamaGen的目标受众是图像生成领域的研究人员和开发者,特别是那些对利用自回归模型进行高质量图像合成感兴趣的人。它适合需要生成高质量图像的AI艺术家、游戏开发者、电影制作者以及任何需要图像生成技术的行业。
总访问量: 474,564,576
占比最多地区: US(19.34%)
1,524
简介
LlamaGen是一个新的图像生成模型家族,它将大型语言模型的原始下一个token预测范式应用于视觉生成领域。该模型通过适当的扩展,无需对视觉信号的归纳偏差即可实现最先进的图像生成性能。LlamaGen重新审视了图像分词器的设计空间、图像生成模型的可扩展性属性以及它们的训练数据质量。
截图
产品特色
提供两种图像分词器,下采样比率分别为16和8。
发布七个类条件生成模型,参数从100M到3B不等。
提供两个文本条件生成模型,参数为700M。
支持在线演示,运行预训练模型。
支持LLM服务框架,可实现300% - 400%的速度提升。
类条件图像生成在ImageNet上的应用。
文本条件图像生成,使用LAION COCO数据集和内部数据。
使用教程
访问LlamaGen的GitHub页面并克隆或下载代码。
阅读并遵循GETTING_STARTED.md文件中的安装指南。
下载预训练模型并将其放置在指定的文件夹中。
运行提供的脚本以生成图像,查看生成结果。
根据需要调整参数和设置以优化生成的图像。
流量来源
直接访问51.61%外链引荐33.46%邮件0.04%
自然搜索12.58%社交媒体2.19%展示广告0.11%
最新流量情况
月访问量
4.92m
平均访问时长
393.01
每次访问页数
6.11
跳出率
36.20%
总流量趋势图
地理流量分布情况
美国
19.34%
中国
13.25%
印度
9.32%
俄罗斯
4.28%
德国
3.63%
地理流量分布全球图