Openemma : 开源的端到端自动驾驶多模态模型

模型训练与部署

Openemma

Openemma

模型训练与部署研究工具 #自动驾驶 #端到端模型 #多模态 #预训练模型 #开源普通产品开源

简介 :

OpenEMMA是一个开源项目，复现了Waymo的EMMA模型，提供了一个端到端框架用于自动驾驶车辆的运动规划。该模型利用预训练的视觉语言模型（VLMs）如GPT-4和LLaVA，整合文本和前视摄像头输入，实现对未来自身路径点的精确预测，并提供决策理由。OpenEMMA的目标是为研究人员和开发者提供易于获取的工具，以推进自动驾驶研究和应用。

需求人群 :

目标受众为自动驾驶领域的研究人员和开发者，他们需要一个端到端的框架来实现和测试自动驾驶算法。OpenEMMA提供的开源工具能够帮助他们快速搭建起自己的自动驾驶系统，并且通过预训练模型加速研发进程。

总访问量： 474.6M

占比最多地区： US(19.34%)

本站浏览量： 67.6K

使用场景

研究人员使用OpenEMMA在nuScenes数据集上测试新的自动驾驶算法。

开发者利用OpenEMMA提供的框架开发出自己的自动驾驶决策系统。

教育机构使用OpenEMMA作为教学工具，向学生展示自动驾驶技术的实际应用。

产品特色

• 利用预训练的视觉语言模型（VLMs）整合文本和视觉输入

• 精确预测自动驾驶车辆的未来路径点

• 提供模型决策的理由和解释

• 支持YOLO-3D等外部工具进行关键物体检测

• 支持多种模型，如GPT-4、LLaVA、Llama和Qwen2

• 生成预测路径的可视化图像和编译视频

• 支持nuScenes数据集进行模型训练和测试

使用教程

1. 设置Conda环境并激活：conda create -n openemma python=3.8; conda activate openemma

2. 克隆OpenEMMA仓库：git clone git@github.com:taco-group/OpenEMMA.git; cd OpenEMMA

3. 安装依赖：pip install -r requirements.txt

4. 设置GPT-4 API访问权限：export OPENAI_API_KEY="your_openai_api_key"

5. 准备输入数据：下载并解压nuScenes数据集

6. 运行OpenEMMA：python main.py --model-path [model] --dataroot [dataset_dir] --version [version] --method openemma

7. 解读输出：包括路径点、决策理由、标注图像和编译视频

精选AI产品推荐

Elicit是一款能够以超人速度分析研究论文的AI助手。它可以自动完成繁琐的研究任务，如论文摘要、数据提取和综合研究发现。用户可以搜索相关论文、获取一句话摘要、从论文中提取详细信息并进行整理、寻找主题和概念等。Elicit的准确度高，使用方便，已受到广大研究者的信赖和好评。

研究工具论文

Ollama是一款本地大语言模型工具，让用户能够快速运行Llama 2、Code Llama和其他模型。用户可以自定义和创建他们自己的模型。Ollama目前支持macOS和Linux，Windows版本即将推出。该产品定位于为用户提供本地化的大语言模型运行环境，以满足用户个性化的需求。

模型训练与部署本地化

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24