# 视觉
Minicpm O
优质新品
MiniCPM-o 2.6 是OpenBMB团队开发的最新多模态大型语言模型(MLLM),具有8B参数,能够在手机等端侧设备上实现高质量的视觉、语音和多模态直播功能。
AI模型#语言模型开源
1,344
Phi 3 Vision 128k Instruct
优质新品
Phi-3 Vision是一个轻量级、最先进的开放多模态模型,基于包括合成数据和经过筛选的公开可用网站在内的数据集构建,专注于文本和视觉的非常高质量的推理密集数据。
AI模型#高质量
2,112
Qwen VL
Qwen-VL 是阿里云推出的通用型视觉语言模型,具有强大的视觉理解和多模态推理能力。
AI图像检测识别#语言模型开源
6,984
Moondream
moondream是一个使用SigLIP、Phi-1.5和LLaVA训练数据集构建的16亿参数模型。
AI模型#语言模型开源
1,164
A Vision Check Up
这篇论文系统评估了大型语言模型(LLMs)生成和识别逐渐复杂的视觉概念的能力,并展示了如何使用文本模型训练初步的视觉表示学习系统。
AI学术研究#视觉开源
360
Internvl
InternVL通过将ViT模型扩展到60亿参数并与语言模型对齐,构建出目前最大的14B开源视觉基础模型,在视觉感知、跨模态检索、多模态对话等广泛任务上取得了32项state-of-the-art性能。
AI模型#基础模型开源
4,980
NEX
NEX是一个媒体技术公司,正在开发可控制的AI模型,用于视觉表达。
AI设计工具#创意
552
Blenny AI
Blenny AI 是一款可以帮助用户对网页进行截图并进行智能分析的 AI 视觉辅助工具。
AI设计工具#视觉
624
Moji AI
Moji AI - Chat & Content AI是您掌握内容创作艺术的终极多合一应用,由先进的人工智能驱动。
AI内容生成#写作
924
Quill News Digest
Quill News Digest是一款不同寻常的日常新闻摘要应用。
AI新闻#摘要
336
Abacus
国外精选
Abacus.AI是全球首个端到端AI平台,为常见的企业应用场景实现实时的大规模深度学习。
模型训练与部署#深度学习
1,224