# 视觉

Minicpm O
优质新品
MiniCPM-o 2.6 是OpenBMB团队开发的最新多模态大型语言模型(MLLM),具有8B参数,能够在手机等端侧设备上实现高质量的视觉、语音和多模态直播功能。
AI模型#语言模型开源
1,344

Phi 3 Vision 128k Instruct
优质新品
Phi-3 Vision是一个轻量级、最先进的开放多模态模型,基于包括合成数据和经过筛选的公开可用网站在内的数据集构建,专注于文本和视觉的非常高质量的推理密集数据。
AI模型#高质量
2,112

Qwen VL
Qwen-VL 是阿里云推出的通用型视觉语言模型,具有强大的视觉理解和多模态推理能力。
AI图像检测识别#语言模型开源
6,984

Moondream
moondream是一个使用SigLIP、Phi-1.5和LLaVA训练数据集构建的16亿参数模型。
AI模型#语言模型开源
1,164

A Vision Check Up
这篇论文系统评估了大型语言模型(LLMs)生成和识别逐渐复杂的视觉概念的能力,并展示了如何使用文本模型训练初步的视觉表示学习系统。
AI学术研究#视觉开源
360

Internvl
InternVL通过将ViT模型扩展到60亿参数并与语言模型对齐,构建出目前最大的14B开源视觉基础模型,在视觉感知、跨模态检索、多模态对话等广泛任务上取得了32项state-of-the-art性能。
AI模型#基础模型开源
4,980

NEX
NEX是一个媒体技术公司,正在开发可控制的AI模型,用于视觉表达。
AI设计工具#创意
552

Blenny AI
Blenny AI 是一款可以帮助用户对网页进行截图并进行智能分析的 AI 视觉辅助工具。
AI设计工具#视觉
624

Moji AI
Moji AI - Chat & Content AI是您掌握内容创作艺术的终极多合一应用,由先进的人工智能驱动。
AI内容生成#写作
924

Quill News Digest
Quill News Digest是一款不同寻常的日常新闻摘要应用。
AI新闻#摘要
336

Abacus
国外精选
Abacus.AI是全球首个端到端AI平台,为常见的企业应用场景实现实时的大规模深度学习。
模型训练与部署#深度学习
1,224
精选AI产品推荐

Nocode
中文精选
NoCode 是一款无需编程经验的平台,允许用户通过自然语言描述创意并快速生成应用,旨在降低开发门槛,让更多人能实现他们的创意。
开发平台#应用开发
912

Listenhub
优质新品
ListenHub 是一款轻量级的 AI 播客生成工具,支持中文和英语,基于前沿 AI 技术,能够快速生成用户感兴趣的播客内容。
音频生成#AI
348

Lovart
国外精选
Lovart 是一款革命性的 AI 设计代理,能够将创意提示转化为艺术作品,支持从故事板到品牌视觉的多种设计需求。
AI设计工具#创意工具
1,128

Fastvlm
FastVLM 是一种高效的视觉编码模型,专为视觉语言模型设计。
AI模型#图像处理开源
564

Smart PDFs
国外精选
Smart PDFs 是一个在线工具,利用 AI 技术快速分析 PDF 文档,并生成简明扼要的总结。
文章摘要#AI
984

Keysync
KeySync 是一个针对高分辨率视频的无泄漏唇同步框架。
视频编辑#视频处理开源
480

Anyvoice
AnyVoice是一款领先的AI声音生成器,采用先进的深度学习模型,将文本转换为与人类无法区分的自然语音。
音频生成#文本转语音
26.38k

Liblibai
中文精选
LiblibAI是一个中国领先的AI创作平台,提供强大的AI创作能力,帮助创作者实现创意。
AI模型#图像生成
344.42k