Voxos
Voxos可用于提高工作效率,节省时间和精力,适用于需要频繁使用语音命令进行工作的用户。
总访问量: 12,610,705
占比最多地区: US(16.50%)
576
简介
Voxos 是一款多功能且用户友好的桌面语音助手,可将LLM集成到日常工作流程中,相比于使用Web UI访问LLM,它更加简化。它非常适合任何使用桌面计算机且希望节省时间和精力的人。此外,您还可以在Voxos的模块化设计基础上构建自己的定制功能。Voxos旨在易于扩展和定制。因此,我们鼓励您以符合当前设计模式的方式定制您的修改,并希望您通过提交MR来为Voxos的所有用户带来益处。
截图
产品特色
紧凑的HUD和系统托盘图标界面。
语音命令的并行处理。
可配置的代理记忆设置。
使用OpenAI的whisper-1进行实时语音命令转录。
支持:OpenAI的聊天补全(例如gpt-3.5-turbo、gpt-4、gpt-4-1106-preview);BYOLLM即将推出……
流量来源
直接访问61.06%外链引荐25.74%邮件0.04%
自然搜索11.67%社交媒体1.42%展示广告0.07%
最新流量情况
月访问量
12798.15k
平均访问时长
572.74
每次访问页数
9.17
跳出率
28.67%
总流量趋势图
地理流量分布情况
美国
16.50%
印度
8.85%
德国
6.54%
法国
6.06%
中国
4.17%
地理流量分布全球图
同类开源产品
Swarm
Swarm是由OpenAI Solutions团队管理的实验性框架,旨在构建、编排和部署多智能体系统。
AI Agents#协调
Ola Friend
Ola Friend是字节跳动豆包推出的首款AI智能体耳机,它通过接入豆包大模型,与豆包APP深度结合,实现了无需打开手机即可通过语音唤醒AI助手的功能。
AI语音助手#智能耳机
Livekit Agents
优质新品
LiveKit Agents 是一个端到端框架,它使开发者能够构建能够通过语音、视频和数据通道与用户互动的智能多模态语音助手(AI代理)。
AI Agents#实时API
EMOVA
EMOVA(EMotionally Omni-present Voice Assistant)是一个多模态语言模型,它能够进行端到端的语音处理,同时保持领先的视觉-语言性能。
AI语音助手#语音识别
Genspark Autopilot Agent
优质新品
Genspark Autopilot Agent是一个能够自动处理任务的智能代理,它通过模拟用户操作来执行任务,即使在用户关闭页面后也能继续工作。
AI Agents#智能代理
Windows Agent Arena
Windows Agent Arena (WAA) 是一个专注于Windows操作系统的可扩展、开源框架,用于测试和开发能够使用语言模型在PC上进行推理、规划和行动的AI代理。
AI Agents#Windows操作系统
EVI 2
EVI 2是Hume AI推出的新型基础语音对语音模型,能够以接近人类的自然方式与用户进行流畅对话。
AI语音助手#语音识别
Muagent
muAgent是一个创新的Agent框架,由知识图谱引擎驱动,支持多Agent编排和协同技术。
AI Agents#知识图谱
Claude For Enterprise
Claude for Enterprise 是一款面向企业级用户的AI助手产品,旨在帮助组织安全地利用内部知识进行协作。
AI Agents#企业协作
替代品
Swarm
Swarm是由OpenAI Solutions团队管理的实验性框架,旨在构建、编排和部署多智能体系统。
AI Agents#协调
EMOVA
EMOVA(EMotionally Omni-present Voice Assistant)是一个多模态语言模型,它能够进行端到端的语音处理,同时保持领先的视觉-语言性能。
AI语音助手#语音识别
Windows Agent Arena
Windows Agent Arena (WAA) 是一个专注于Windows操作系统的可扩展、开源框架,用于测试和开发能够使用语言模型在PC上进行推理、规划和行动的AI代理。
AI Agents#Windows操作系统
Muagent
muAgent是一个创新的Agent框架,由知识图谱引擎驱动,支持多Agent编排和协同技术。
AI Agents#知识图谱
Open LLM VTuber
Open-LLM-VTuber 是一个开源项目,旨在通过语音与大型语言模型(LLM)进行交互,具有实时的Live2D面部捕捉和跨平台的长期记忆功能。
AI Agents#VTuber
Multi Agent Concierge
multi-agent-concierge是一个多代理礼宾系统,它通过多个专门的代理来完成复杂的任务,并通过一个“礼宾”代理来引导用户到正确的代理。
AI Agents#客户服务
Agent Service Toolkit
agent-service-toolkit是一个用于运行基于LangGraph的AI代理服务的完整工具包,包括LangGraph代理、FastAPI服务、客户端以及Streamlit应用程序,提供了从代理定义到用户界面的完整设置。
AI Agents#LangGraph
Agentk
AgentK是一个自进化的模块化自代理通用人工智能(AGI)模型,由多个合作的代理组成,能够根据用户的需求构建新的代理来完成任务。
AI Agents#模块化
Qwen2 Audio Instruct Demo
Qwen2 Audio Instruct Demo 是一个基于音频指令的交互式演示网站,它利用最新的人工智能技术,让用户通过语音指令与网页进行互动。
AI语音助手#语音识别