Videochat
目标受众为开发者和企业用户,特别是那些需要在应用中集成实时语音交互数字人功能的人。VideoChat通过提供端到端解决方案和高度定制化的选项,使得用户可以快速部署和使用数字人技术,满足个性化的交互需求。
总访问量: 474,564,576
占比最多地区: US(19.34%)
2,196
简介
VideoChat是一个实时语音交互数字人项目,支持端到端语音方案(GLM-4-Voice - THG)和级联方案(ASR-LLM-TTS-THG)。用户可以自定义数字人的形象和音色,支持音色克隆,无需训练,首包延迟低至3秒。该项目利用了最新的人工智能技术,包括自动语音识别(ASR)、大型语言模型(LLM)、端到端多模态大型语言模型(MLLM)、文本到语音(TTS)和说话头生成(THG),为用户提供了一个高度定制化和低延迟的交互体验。
截图
产品特色
支持端到端语音方案(GLM-4-Voice - THG)和级联方案(ASR-LLM-TTS-THG)
自定义数字人形象与音色,无需训练
支持音色克隆功能
首包延迟低至3秒
在线demo提供实时体验
技术选型包括ASR、LLM、MLLM、TTS和THG
提供本地部署指南和API-KEY配置
使用教程
1. 克隆项目代码到本地:使用git clone命令克隆项目代码
2. 环境配置:根据项目要求配置Ubuntu系统、Python版本和CUDA版本
3. 安装依赖:使用pip install命令安装requirements.txt中的依赖
4. 下载权重文件:根据指南下载所需的权重文件
5. 配置API-KEY:如果需要使用API服务,按照指南配置API-KEY
6. 启动服务:运行python app.py启动服务
7. 使用自定义数字人:根据指南添加自定义数字人形象和音色
8. 测试和优化:运行服务后进行测试,并根据需要进行优化
流量来源
直接访问51.61%外链引荐33.46%邮件0.04%
自然搜索12.58%社交媒体2.19%展示广告0.11%
最新流量情况
月访问量
4.92m
平均访问时长
393.01
每次访问页数
6.11
跳出率
36.20%
总流量趋势图
地理流量分布情况
美国
19.34%
中国
13.25%
印度
9.32%
俄罗斯
4.28%
德国
3.63%
地理流量分布全球图
同类开源产品
Spillmate
Spillmate是一个AI聊天机器人,专注于为年轻成年人、学生和专业人士提供压力和心理健康管理支持。
聊天机器人#认知行为疗法
1stroke
1Stroke是一款AI助手,能在网页任何文本框中生成有意义的回复,加快沟通速度。
聊天机器人#智能回复
Hive Chat
HiveChat 是一款专为中小型团队打造的 AI 聊天应用,支持多用户模式及权限管理,方便团队在协作中高效利用 AI 技术。
聊天机器人#团队协作
Puretalk.ai
Puretalk AI®提供智能响应式AI平台,从语音代理到聊天机器人,实现人类般流畅对话,提升满意度和简化运营。
聊天机器人#智能对话
Getbutton AI Chatbots For Websites
ChatGPT是一个基于网站内容训练的AI聊天机器人,可以24/7代表您与访客交流。
聊天机器人#客户服务
Brutalgpt
BrutalGPT是一个提供直言不讳反馈的AI对话平台,用户可以通过与AI对话获取产品构想或个人反馈。
聊天机器人#反馈
SELPHO
Selpho提供AI技术驱动的医疗保健解决方案,包括MediDoc AI Chatbot、Vision DocScanner和AI Physician Handbook。
聊天机器人#medical AI
Qwen3
优质新品
Qwen3是通义千问团队推出的最新大型语言模型,旨在通过强大的思考和快速响应能力,为用户提供高效、灵活的解决方案。
聊天机器人
Athenaiq
Athena IQ是一款智能问答系统,通过训练数据并快速部署聊天机器人,帮助企业提供快速准确的答案,节省时间和精力。
聊天机器人#自动化
替代品
Purechat
PureChat 是一款结合 AI 和前沿技术的现代聊天应用,采用 Vue3 和 ElementPlus 构建,内置 OpenAI、Ollama、DeepSeek 等大语言模型。
聊天机器人#AI
Taoavatar
TaoAvatar 是一种高保真、轻量级的 3D 高斯喷溅技术(3DGS)全身虚拟人头像,能够生成个性化的全身动态头像,广泛应用于增强现实等场景。
数字人#增强现实
Openchat
优质新品
OpenChat 是一个现代化的全栈 AI 聊天应用,采用 React 和 Cloudflare Workers 构建,结合 Connect RPC 实现高效通信,通过 Tauri 支持多平台客户端。
聊天机器人#聊天
Open Multi Agent Canvas
Open Multi-Agent Canvas 是一个基于 Next.js、LangGraph 和 CopilotKit 构建的开源多智能体聊天界面。
聊天机器人#开源
Liteavatar
LiteAvatar是一个音频驱动的实时2D头像生成模型,主要用于实时聊天场景。
聊天机器人#虚拟头像
Deephermes 3 Llama 3 8B Preview
DeepHermes 3 是 NousResearch 开发的先进语言模型,能够通过系统性推理提升回答准确性。
聊天机器人#推理
Hivechat
HiveChat是一款面向中小团队的AI聊天应用,支持多种主流AI模型,如Deepseek、Open AI、Claude和Gemini等。
聊天机器人#团队协作
Gemini Pro Chatbot
Gemini Pro Chatbot 是一款基于 Google Gemini Pro AI 模型开发的移动聊天应用。
聊天机器人#聊天
Deepseek Project
DeepSeek Project 是一个综合性技术项目,旨在通过集成 DeepSeek API 提供多种功能。
聊天机器人#聊天机器人