Unimumo
目标受众包括音乐制作人、舞蹈编导、视频游戏开发者、虚拟现实内容创作者和任何需要生成或同步音乐、文本和动作数据的专业人士。UniMuMo能够提供跨模态的创作工具,帮助他们更高效地创作和实现创意。
总访问量: 231
占比最多地区: US(100.00%)
780
简介
UniMuMo是一个多模态模型,能够将任意文本、音乐和动作数据作为输入条件,生成跨所有三种模态的输出。该模型通过将音乐、动作和文本转换为基于令牌的表示,通过统一的编码器-解码器转换器架构桥接这些模态。它通过微调现有的单模态预训练模型,显著降低了计算需求。UniMuMo在音乐、动作和文本模态的所有单向生成基准测试中都取得了有竞争力的结果。
截图
产品特色
支持文本、音乐和动作数据的输入条件,生成跨模态的输出。
通过节奏模式对未配对的音乐和动作数据进行对齐,利用现有的大规模音乐和动作数据集。
采用统一的编码器-解码器转换器架构,将音乐、动作和文本桥接。
提出了音乐运动并行生成方案,将所有音乐和动作生成任务统一到单一的转换器解码器架构中。
通过微调现有的预训练单模态模型来设计模型,显著降低了计算需求。
在音乐、动作和文本模态的所有单向生成基准测试中都取得了有竞争力的结果。
使用教程
访问UniMuMo的在线演示页面。
阅读页面上的介绍,了解模型的功能和背景。
根据需要选择输入模态,如文本、音乐或动作。
输入具体的文本描述、音乐片段或动作数据。
提交输入数据,等待模型生成跨模态的输出。
查看生成的结果,如音乐、动作或文本描述。
根据需要调整输入数据或参数,重复生成过程以获得更满意的结果。
流量来源
直接访问83.42%外链引荐5.48%邮件0.03%
自然搜索4.83%社交媒体5.48%展示广告0.75%
最新流量情况
月访问量
188
平均访问时长
0.00
每次访问页数
1.01
跳出率
49.75%
总流量趋势图
地理流量分布情况
美国
100.00%
地理流量分布全球图