Pixtral 12B
Pixtral 12B
Pixtral 12B 适合需要进行复杂图像和文本处理的用户,如数据分析师、研究人员和开发人员。它的多模态能力使其成为处理图表、文档和图像的理想选择,同时保持了文本处理的高性能,适合需要在文本和图像之间进行复杂交互的场景。
总访问量: 11,651,958
占比最多地区: FR(36.13%)
384
简介
Pixtral 12B 是 Mistral AI 团队开发的一款多模态 AI 模型,它能够理解自然图像和文档,具备出色的多模态任务处理能力,同时在文本基准测试中也保持了最先进的性能。该模型支持多种图像尺寸和宽高比,能够在长上下文窗口中处理任意数量的图像,是 Mistral Nemo 12B 的升级版,专为多模态推理而设计,不牺牲关键文本处理能力。
截图
产品特色
原生多模态,通过交错图像和文本数据进行训练。
在多模态任务上表现出色,特别是在指令遵循方面。
在文本基准测试中保持最先进性能。
支持可变图像尺寸和宽高比。
能够在长上下文窗口中处理多张图像。
新的视觉编码器,支持原生可变图像尺寸。
多模态 Transformer 解码器,能够处理任意数量的图像。
使用教程
通过 Mistral AI 的平台或 Le Chat 界面尝试 Pixtral 12B。
在模型列表中选择 Pixtral 12B 并上传需要处理的图像。
提出关于图像的问题或指令,Pixtral 12B 将根据图像内容给出回答。
利用 API 调用,将 Pixtral 12B 集成到各种应用程序和工作流程中。
使用 mistral-inference 工具在本地运行模型,下载模型文件并加载。
构建请求,包括图像 URL 和文本提示,发送给模型进行处理。
获取模型的输出结果,并根据需要进一步处理或展示。
流量来源
直接访问58.47%外链引荐36.44%邮件0.08%
自然搜索3.50%社交媒体1.44%展示广告0.07%
最新流量情况
月访问量
8127.05k
平均访问时长
233.84
每次访问页数
2.91
跳出率
45.52%
总流量趋势图
地理流量分布情况
法国
36.13%
俄罗斯
8.82%
美国
5.37%
德国
5.05%
印度
3.64%
地理流量分布全球图