Ego Exo4D
支持多模态机器感知研究,用于日常生活活动的视频分析和理解
总访问量: 3,017
占比最多地区: US(94.96%)
1,128
简介
Ego-Exo4D 是一个多模态多视角视频数据集和基准挑战,以捕捉技能人类活动的自我中心和外部中心视频为中心。它支持日常生活活动的多模态机器感知研究。该数据集由 839 位佩戴摄像头的志愿者在全球 13 个城市收集,捕捉了 1422 小时的技能人类活动视频。该数据集提供了专家评论、参与者提供的教程样式的叙述和一句话的原子动作描述等三种自然语言数据集,配对视频使用。Ego-Exo4D 还捕获了多视角和多种感知模态,包括多个视角、七个麦克风阵列、两个 IMUs、一个气压计和一个磁强计。数据集记录时严格遵守隐私和伦理政策,参与者的正式同意。欲了解更多信息,请访问官方网站。
截图
产品特色
多模态多视角视频数据集
同步的自我中心和外部中心视图
多种感知模态,包括麦克风、IMUs、气压计等
三种自然语言数据集
支持研究日常生活活动的多模态机器感知
流量来源
直接访问47.60%外链引荐27.42%邮件0.04%
自然搜索6.58%社交媒体17.43%展示广告0.94%
最新流量情况
月访问量
2702
平均访问时长
76.22
每次访问页数
2.05
跳出率
58.29%
总流量趋势图
地理流量分布情况
美国
94.96%
瑞士
5.04%
地理流量分布全球图
同类开源产品
MIT MAIA
优质新品
MAIA(Multimodal Automated Interpretability Agent)是由MIT计算机科学与人工智能实验室(CSAIL)开发的一个自动化系统,旨在提高人工智能模型的解释性。
研究工具#自动化
Arxiv Summarizer
该产品是一个 Python 脚本,利用 Gemini API 从 arXiv 获取和总结研究论文。
研究工具#论文摘要
Surfsense
SurfSense 是一款开源的 AI 研究助手,它将多种外部资源(如搜索引擎、Slack、Notion 等)整合在一起,帮助用户高效地进行研究和信息管理。
研究工具#信息管理
Deerflow
DeerFlow 是一个深度研究框架,旨在结合语言模型与如网页搜索、爬虫及 Python 执行等专用工具,以推动深入研究工作。
研究工具#开源
Camerabench
CameraBench 是一个用于分析视频中相机运动的模型,旨在通过视频理解相机的运动模式。
研究工具#相机运动
Atypica.ai
中文精选
Atypica.AI 是一个专注于商业研究的智能体框架,利用语言模型来分析和理解消费者情绪、市场认知与决策偏好。
研究工具#消费者行为
Smoldocling
SmolDocling-256M-preview是由ds4sd推出的一个具有256M参数的语言模型,专注于医学领域。
研究工具#医学文本处理
LBM
该产品是基于格子玻尔兹曼方法(LBM)的项目,格子玻尔兹曼方法是一种用于计算流体动力学的数值技术,通过模拟微观粒子的运动来描述宏观流体行为。
研究工具#流体动力学
Customgpt.ai Researcher
优质新品
CustomGPT.ai Researcher 是一款基于人工智能的深度研究工具,旨在帮助用户快速生成高质量的文章。
研究工具#写作辅助
替代品