# 多模态交互
多模态交互
TEN Agent
国外精选
TEN Agent 是基于 TEN 框架构建的实时对话 AI引擎,为开发者提供快速、高效的工具来构建实时对话式 AI Agent,如AI虚拟客服、AI 口语陪练、AI 情感陪伴、AI 个人助理等。
个人助理#Voice Agent开源
3,648
Chatwise
ChatWise是一款高性能的AI聊天工具,支持GPT-4、Claude、Gemini等主流语言模型。
聊天机器人#隐私保护
3,804
UI TARS 7B SFT
UI-TARS 是由字节跳动研究团队开发的下一代原生GUI代理模型,旨在通过人类般的感知、推理和行动能力与图形用户界面进行无缝交互。
自动化工作流#自动化开源
1,116
Trae
Trae 是一款面向开发者的 AI 驱动的集成开发环境(IDE)。
代码助手#编程
75.34k
Livekit Agents
优质新品
LiveKit Agents 是一个端到端框架,它使开发者能够构建能够通过语音、视频和数据通道与用户互动的智能多模态语音助手(AI代理)。
AI Agents#实时API
1,992
Psydi
PsyDI是一个多模态互动聊天机器人,旨在通过分析用户的多模态输入来探索用户潜在的认知风格,并最终确定他们的迈尔斯-布里格斯类型指标(MBTI)。
AI聊天机器人#性格分析开源
2,556
Ai Discord Bot PigPig
PigPig是一个基于多模态大型语言模型(LLM)的Discord机器人,旨在通过自然语言与用户互动。
AI聊天机器人#多模态交互开源
648
Conva.ai
优质新品
Conva.AI是一个创新的AI助手即服务平台,它结合了最新的GenAI技术与6年以上的行业经验,提供快速构建、部署和管理AI助手及其功能的能力。
开发与工具#自然语言处理
768
GPT 4o
GPT-4o('o'代表'omni')是自然人机交互的重要一步,它可以接受任意组合的文本、音频、图像和视频输入,并生成任意组合的文本、音频和图像输出。
AI模型#自然语言处理
924
Open WebUI
Open WebUI是一个为LLMs(大型语言模型)设计的友好型Web用户界面,支持Ollama和OpenAI兼容的API。
AI工具#WebUI开源
29.44k