# 视觉识别
视觉识别
UI TARS Desktop
优质新品
UI-TARS-desktop 是由字节跳动开发的一款桌面客户端应用,它基于 UI-TARS 视觉语言模型,允许用户通过自然语言与计算机进行交互,完成各种任务。
个人助理#自然语言处理开源
5,772
理想同学
中文精选
理想同学是由理想汽车依托自研大模型精心打造的一款人工智能应用,旨在为用户提供一个随时在线的智能助手。
个人助理#知识问答
3,588
Lloyd
Lloyd是一款结合了人工智能视觉识别技术的应用,它能够通过视频捕捉来解锁知识、洞察和信息,帮助用户在任何时间、任何地点增强视频通讯体验。
视频编辑#视觉识别
564
Llama 3.2 90B Vision
优质新品
Llama-3.2-90B-Vision是Meta公司发布的一款多模态大型语言模型(LLM),专注于视觉识别、图像推理、图片描述和回答有关图片的一般问题。
AI模型#机器学习开源
708
Llava OneVision
LLaVA-OneVision是一款由字节跳动公司与多所大学合作开发的多模态大型模型(LMMs),它在单图像、多图像和视频场景中推动了开放大型多模态模型的性能边界。
AI模型#视觉识别开源
1,680
Unitor.ai
Unitor.ai是一个个人语音和视觉助手,提供自然、温暖的语音对话,适用于所有年龄段和兴趣。
个人助理#智能助手
1,140
Navaiguide
NavAIGuide是一个可扩展的多模态智能框架,通过访问移动和桌面生态系统中的应用程序,实现计划和用户查询。
AI Agents#视觉识别开源
444