Minicpm Llama3 V 2.5
Minicpm Llama3 V 2.5
该产品适合需要在端侧设备上进行高效多模态交互的开发者和企业,如智能手机、平板电脑等移动设备,以及需要进行图像识别、语言处理和多语言交互的场景。
总访问量: 474,564,576
占比最多地区: US(19.34%)
7,596
简介
MiniCPM-Llama3-V 2.5 是 OpenBMB 项目中最新发布的端侧多模态大模型,具备8B参数量,支持超过30种语言的多模态交互,并在多模态综合性能上超越了多个商用闭源模型。该模型通过模型量化、CPU、NPU、编译优化等技术实现了高效的终端设备部署,具有优秀的OCR能力、可信行为以及多语言支持等特点。
截图
产品特色
领先的性能:在OpenCompass榜单上平均得分65.1,超越多个商用闭源多模态大模型。
优秀的OCR能力:OCRBench得分达到725,支持高分辨率图像输入和全文OCR信息提取。
可信行为:通过RLAIF-V对齐技术,具有较低的幻觉率和可信的多模态行为。
多语言支持:支持30+种语言的多模态能力,通过少量翻译数据实现跨语言泛化。
高效部署:通过模型量化和编译优化技术,实现终端设备上的快速推理和图像编码。
简易微调和本地WebUI Demo部署:支持通过Huggingface Transformers库和SWIFT框架进行微调。
使用教程
克隆OpenBMB/MiniCPM-V的代码仓库到本地。
创建conda环境并安装所需的依赖。
根据设备类型(如NVIDIA GPU、Mac MPS等)运行本地WebUI Demo。
使用Huggingface Transformers库或SWIFT框架对模型进行微调以适应特定任务。
流量来源
直接访问51.61%外链引荐33.46%邮件0.04%
自然搜索12.58%社交媒体2.19%展示广告0.11%
最新流量情况
月访问量
4.92m
平均访问时长
393.01
每次访问页数
6.11
跳出率
36.20%
总流量趋势图
地理流量分布情况
美国
19.34%
中国
13.25%
印度
9.32%
俄罗斯
4.28%
德国
3.63%
地理流量分布全球图