Unified IO 2
总访问量: 442
占比最多地区: US(69.88%)
1,380
简介
Unified-IO 2是一个统一的多模态生成模型,能够理解和生成图像、文本、音频和动作。它使用单个编码器-解码器Transformer模型,将不同模式(图像、文本、音频、动作等)的输入和输出都表示为一个共享的语义空间进行处理。该模型从头开始在大规模的多模态预训练语料上进行训练,使用了多模态的去噪目标进行优化。为了学会广泛的技能,该模型还在120个现有数据集上进行微调,这些数据集包含提示和数据增强。Unified-IO 2在GRIT基准测试中达到了最先进的性能,在30多个基准测试中都取得了强劲的结果,包括图像生成和理解、文本理解、视频和音频理解以及机器人操作。
截图
产品特色
图像 caption
执行自由形式指令
图像编辑
对象检测
语义分割
表面法线估计
基于图像的音频生成
流量来源
直接访问48.49%外链引荐29.31%邮件0.09%
自然搜索15.28%社交媒体6.40%展示广告0.43%
最新流量情况
月访问量
333
平均访问时长
0.00
每次访问页数
1.00
跳出率
100.00%
总流量趋势图
地理流量分布情况
美国
69.88%
中国
30.12%
地理流量分布全球图