SPRIGHT : 提高文本到图像模型中空间一致性的解决方案

SPRIGHT

AI图像生成 AI图像检测识别 #文本到图像 #空间一致性 #视觉语言模型 #视觉语言数据集普通产品开源

简介 :

SPRIGHT是一个专注于空间关系的大规模视觉语言数据集和模型。它通过重新描述600万张图像构建了SPRIGHT数据集，显著增加了描述中的空间短语。该模型在444张包含大量物体的图像上进行微调训练，从而优化生成具有空间关系的图像。SPRIGHT在多个基准测试中实现了空间一致性的最新水平，同时提高了图像质量评分。

需求人群 :

SPRIGHT可应用于任何需要生成具有合理空间布局的图像的场景，如室内设计、平面布局、机器人环境模拟等。

总访问量： 535

占比最多地区： US(71.88%)

本站浏览量： 76.7K

使用场景

一间带有壁炉的客厅,沙发在壁炉的右侧,茶几在沙发前方。

一个装满水果的篮子,苹果在左侧,香蕉在右侧,桔子在中间。

一座城市的街景,高楼大厦在道路的两侧,路中间有一个喷泉。

产品特色

大规模空间关系数据集SPRIGHT

在具有大量物体的图像上微调训练以优化空间一致性