Open LLM VTuber
Open LLM VTuber
目标受众为开发者、技术爱好者和AI研究者,他们可以利用Open-LLM-VTuber来创建自己的虚拟角色,进行自然语言处理和机器学习的研究,或者开发与AI交互的应用程序。
总访问量: 474,564,576
占比最多地区: US(19.34%)
1,104
简介
Open-LLM-VTuber 是一个开源项目,旨在通过语音与大型语言模型(LLM)进行交互,具有实时的Live2D面部捕捉和跨平台的长期记忆功能。该项目支持macOS、Windows和Linux平台,允许用户选择不同的语音识别和语音合成后端,以及自定义的长期记忆解决方案。它特别适合希望在不同平台上实现与AI进行自然语言对话的开发者和爱好者。
截图
产品特色
支持与任何OpenAI-API兼容的大型语言模型后端进行语音交互。
可以自定义选择语音识别和文本到语音合成的提供者。
集成MemGPT以实现长期记忆功能,提供持续的聊天体验。
支持Live2D模型,根据LLM响应自动控制面部表情。
能够在macOS上利用GPU加速,显著降低延迟。
支持多种语言,包括中文。
允许完全离线运行,保护用户隐私。
使用教程
安装必要的依赖项,如FFmpeg和Python虚拟环境。
克隆Open-LLM-VTuber的代码库到本地。
根据需要配置项目中的conf.yaml文件,选择语音识别和语音合成的后端。
运行server.py启动WebSocket通信服务器。
打开index.html文件以启动前端界面。
运行launch.py或main.py以启动后端处理。
通过语音与大型语言模型进行交互,观察Live2D模型的实时反应。
流量来源
直接访问51.61%外链引荐33.46%邮件0.04%
自然搜索12.58%社交媒体2.19%展示广告0.11%
最新流量情况
月访问量
4.92m
平均访问时长
393.01
每次访问页数
6.11
跳出率
36.20%
总流量趋势图
地理流量分布情况
美国
19.34%
中国
13.25%
印度
9.32%
俄罗斯
4.28%
德国
3.63%
地理流量分布全球图
同类开源产品
Swarm
Swarm是由OpenAI Solutions团队管理的实验性框架,旨在构建、编排和部署多智能体系统。
AI Agents#协调
Ola Friend
Ola Friend是字节跳动豆包推出的首款AI智能体耳机,它通过接入豆包大模型,与豆包APP深度结合,实现了无需打开手机即可通过语音唤醒AI助手的功能。
AI语音助手#智能耳机
Livekit Agents
优质新品
LiveKit Agents 是一个端到端框架,它使开发者能够构建能够通过语音、视频和数据通道与用户互动的智能多模态语音助手(AI代理)。
AI Agents#实时API
EMOVA
EMOVA(EMotionally Omni-present Voice Assistant)是一个多模态语言模型,它能够进行端到端的语音处理,同时保持领先的视觉-语言性能。
AI语音助手#语音识别
Genspark Autopilot Agent
优质新品
Genspark Autopilot Agent是一个能够自动处理任务的智能代理,它通过模拟用户操作来执行任务,即使在用户关闭页面后也能继续工作。
AI Agents#智能代理
Windows Agent Arena
Windows Agent Arena (WAA) 是一个专注于Windows操作系统的可扩展、开源框架,用于测试和开发能够使用语言模型在PC上进行推理、规划和行动的AI代理。
AI Agents#Windows操作系统
EVI 2
EVI 2是Hume AI推出的新型基础语音对语音模型,能够以接近人类的自然方式与用户进行流畅对话。
AI语音助手#语音识别
Muagent
muAgent是一个创新的Agent框架,由知识图谱引擎驱动,支持多Agent编排和协同技术。
AI Agents#知识图谱
Claude For Enterprise
Claude for Enterprise 是一款面向企业级用户的AI助手产品,旨在帮助组织安全地利用内部知识进行协作。
AI Agents#企业协作
替代品
Swarm
Swarm是由OpenAI Solutions团队管理的实验性框架,旨在构建、编排和部署多智能体系统。
AI Agents#协调
EMOVA
EMOVA(EMotionally Omni-present Voice Assistant)是一个多模态语言模型,它能够进行端到端的语音处理,同时保持领先的视觉-语言性能。
AI语音助手#语音识别
Windows Agent Arena
Windows Agent Arena (WAA) 是一个专注于Windows操作系统的可扩展、开源框架,用于测试和开发能够使用语言模型在PC上进行推理、规划和行动的AI代理。
AI Agents#Windows操作系统
Muagent
muAgent是一个创新的Agent框架,由知识图谱引擎驱动,支持多Agent编排和协同技术。
AI Agents#知识图谱
Open LLM VTuber
Open-LLM-VTuber 是一个开源项目,旨在通过语音与大型语言模型(LLM)进行交互,具有实时的Live2D面部捕捉和跨平台的长期记忆功能。
AI Agents#VTuber
Multi Agent Concierge
multi-agent-concierge是一个多代理礼宾系统,它通过多个专门的代理来完成复杂的任务,并通过一个“礼宾”代理来引导用户到正确的代理。
AI Agents#客户服务
Agent Service Toolkit
agent-service-toolkit是一个用于运行基于LangGraph的AI代理服务的完整工具包,包括LangGraph代理、FastAPI服务、客户端以及Streamlit应用程序,提供了从代理定义到用户界面的完整设置。
AI Agents#LangGraph
Agentk
AgentK是一个自进化的模块化自代理通用人工智能(AGI)模型,由多个合作的代理组成,能够根据用户的需求构建新的代理来完成任务。
AI Agents#模块化
Qwen2 Audio Instruct Demo
Qwen2 Audio Instruct Demo 是一个基于音频指令的交互式演示网站,它利用最新的人工智能技术,让用户通过语音指令与网页进行互动。
AI语音助手#语音识别