简介
SCENIC是一个文本条件的场景交互模型,能够适应具有不同地形的复杂场景,并支持使用自然语言进行用户指定的语义控制。该模型通过用户指定的轨迹作为子目标和文本提示,来导航3D场景。SCENIC利用层次化推理场景的方法,结合运动与文本之间的帧对齐,实现不同运动风格之间的无缝过渡。该技术的重要性在于其能够生成符合真实物理规则和用户指令的角色导航动作,对于虚拟现实、增强现实以及游戏开发等领域具有重要意义。
截图

产品特色
层次化推理:通过目标中心规范化和人中心距离场进行高级别和细节级别的场景推理。
帧对齐:模型利用帧对齐实现运动与文本之间的无缝过渡。
数据稀缺性缓解:通过将真实人类运动片段适配到合成地形上,增加数据多样性。
多场景泛化:模型在多个真实世界场景数据集上进行测试,展现出良好的泛化能力。
文本控制:能够根据用户的文本指令生成相应的角色动作。
避免穿透和漂浮:通过目标中心规范化避免角色穿透和漂浮现象。
多样化动作生成:能够生成如“跳过凳子并坐下”等复杂动作。
使用教程
1. 访问SCENIC的官方网站并下载模型。
2. 阅读并理解模型的使用文档和API。
3. 准备或获取3D场景数据和用户指令文本。
4. 将3D场景数据和用户指令输入SCENIC模型。
5. 根据模型输出的角色动作,进行后续的动画生成或游戏开发。
6. 根据需要调整模型参数,优化动作生成效果。
7. 将生成的动作应用到虚拟现实、增强现实或游戏中。
流量来源
直接访问 | 0.00% | 外链引荐 | 0.00% | 邮件 | 0.00% |
自然搜索 | 0.00% | 社交媒体 | 0.00% | 展示广告 | 0.00% |
最新流量情况
月访问量
0
平均访问时长
0.00
每次访问页数
0.00
跳出率
0
总流量趋势图
同类开源产品

Primitiveanything
PrimitiveAnything 是一种利用自回归变换器生成 3D 模型的技术,能够自动创建细致的 3D 原始装配体。
3D建模#深度学习

Hyperpad
hyperPad是一款在iPad上创建和发布游戏的工具,无需编码。
游戏生成#游戏开发

Blender MCP
Blender MCP 是一款将 Blender 与 Claude AI 通过模型上下文协议 (MCP) 相连的插件,使 AI 可以直接与 Blender 交互和控制。
3D建模#Blender

Pokemongym
PokemonGym 是一个基于服务器 - 客户端架构的平台,专为 AI 代理设计,能够在 Pokemon Red 游戏中进行评估和训练。
游戏生成#游戏

Vibe Draw
Vibe Draw 是一款强大的 AI 驱动平台,能够快速将粗略草图转化为专业质量的 3D 模型。
3D建模#AI 工具

Meshifai
MeshifAI 是一个先进的文本到 3D 模型生成平台,旨在帮助开发者在应用程序、游戏和网站中快速集成高质量的 3D 生成功能。
3D建模#AI 技术

LHM
LHM(大规模可动画人类重建模型)利用多模态变压器架构进行高保真 3D 头像重建,支持从单张图像生成可动画的 3D 人类形象。
3D建模#人类模型

Cube
Cube 是一个强大的 3D 智能生成模型,旨在帮助开发者在 Roblox 平台上创建各种 3D 资产和场景。
3D建模#生成式 AI

Style3d
中文精选
Style3D是一款全新的 3D 服装仿真建模软件,采用了最新的 AI 技术来提升服装设计的效率和精准度。
3D建模#服装设计
替代品

Primitiveanything
PrimitiveAnything 是一种利用自回归变换器生成 3D 模型的技术,能够自动创建细致的 3D 原始装配体。
3D建模#深度学习

Blender MCP
Blender MCP 是一款将 Blender 与 Claude AI 通过模型上下文协议 (MCP) 相连的插件,使 AI 可以直接与 Blender 交互和控制。
3D建模#Blender

Pokemongym
PokemonGym 是一个基于服务器 - 客户端架构的平台,专为 AI 代理设计,能够在 Pokemon Red 游戏中进行评估和训练。
游戏生成#游戏

LHM
LHM(大规模可动画人类重建模型)利用多模态变压器架构进行高保真 3D 头像重建,支持从单张图像生成可动画的 3D 人类形象。
3D建模#人类模型

Cube
Cube 是一个强大的 3D 智能生成模型,旨在帮助开发者在 Roblox 平台上创建各种 3D 资产和场景。
3D建模#生成式 AI

Spatiallm
SpatialLM 是一个专为处理 3D 点云数据设计的大型语言模型,能够生成结构化的 3D 场景理解输出,包括建筑元素和对象的语义类别。
3D建模#点云处理

MIDI
MIDI是一种创新的图像到3D场景生成技术,它利用多实例扩散模型,能够从单张图像中直接生成具有准确空间关系的多个3D实例。
3D建模#图像处理

Meshpad
MeshPad 是一种创新的生成式设计工具,专注于从草图输入创建和编辑 3D 网格模型。
3D建模#艺术化设计

WHAM
WHAM(World and Human Action Model)是由微软研究院开发的一种生成式模型,专门用于生成游戏场景和玩家行为。
游戏生成#游戏开发
精选AI产品推荐

Nocode
中文精选
NoCode 是一款无需编程经验的平台,允许用户通过自然语言描述创意并快速生成应用,旨在降低开发门槛,让更多人能实现他们的创意。
开发平台#应用开发
912

Listenhub
优质新品
ListenHub 是一款轻量级的 AI 播客生成工具,支持中文和英语,基于前沿 AI 技术,能够快速生成用户感兴趣的播客内容。
音频生成#AI
348

Lovart
国外精选
Lovart 是一款革命性的 AI 设计代理,能够将创意提示转化为艺术作品,支持从故事板到品牌视觉的多种设计需求。
AI设计工具#创意工具
1,128

Fastvlm
FastVLM 是一种高效的视觉编码模型,专为视觉语言模型设计。
AI模型#图像处理开源
564

Smart PDFs
国外精选
Smart PDFs 是一个在线工具,利用 AI 技术快速分析 PDF 文档,并生成简明扼要的总结。
文章摘要#AI
984

Keysync
KeySync 是一个针对高分辨率视频的无泄漏唇同步框架。
视频编辑#视频处理开源
480

Anyvoice
AnyVoice是一款领先的AI声音生成器,采用先进的深度学习模型,将文本转换为与人类无法区分的自然语音。
音频生成#文本转语音
26.38k

Liblibai
中文精选
LiblibAI是一个中国领先的AI创作平台,提供强大的AI创作能力,帮助创作者实现创意。
AI模型#图像生成
344.42k