百聆
该产品适合需要高效语音交互体验的用户,无论是日常对话、信息查询还是任务管理,百聆都能提供便捷的语音支持,尤其适合对硬件配置要求不高但对语音交互质量有较高要求的用户。
总访问量: 474,564,576
占比最多地区: US(19.34%)
1,092
简介
百聆是一个开源的语音对话助手,旨在通过语音与用户进行自然的对话。该项目结合了语音识别(ASR)、语音活动检测(VAD)、大语言模型(LLM)和语音合成(TTS)技术,提供高质量的语音对话体验。其主要优点是无需GPU即可实现类GPT-4o的对话效果,适用于各种边缘设备和低资源环境。百聆完全开源,鼓励社区贡献与二次开发,用户可以根据自己的需求进行定制和优化。
截图
产品特色
高效开源模型:百聆使用多个开源模型,确保高效、可靠的语音对话体验。
无需GPU:通过优化,可本地部署,仍能提供类GPT-4的性能表现。
模块化设计:ASR、VAD、LLM和TTS模块相互独立,可根据需求进行替换和升级。
支持记忆功能:具备持续学习能力,能够记忆用户的偏好与历史对话,提供个性化的互动体验。
支持工具调用:灵活集成外部工具,用户可通过语音直接请求信息或执行操作,提升助手的实用性。
支持任务管理:高效管理用户任务,能够跟踪进度、设置提醒,并提供动态更新,确保用户不错过任何重要事项。
使用教程
1. 克隆项目仓库:git clone https://github.com/wwbin2017/bailing.git,然后进入项目目录cd bailing。
2. 安装所需依赖:pip install -r requirements.txt。
3. 配置环境变量:打开config/config.yaml配置ASR LLM等相关配置,下载SenseVoiceSmall到目录models/SenseVoiceSmall,并获取deepseek的api_key。
4. 启动后端服务:cd server,运行python server.py(可选)。
5. 启动主程序:运行python main.py,系统会等待语音输入,用户即可开始使用百聆进行语音对话。
流量来源
直接访问51.61%外链引荐33.46%邮件0.04%
自然搜索12.58%社交媒体2.19%展示广告0.11%
最新流量情况
月访问量
4.92m
平均访问时长
393.01
每次访问页数
6.11
跳出率
36.20%
总流量趋势图
地理流量分布情况
美国
19.34%
中国
13.25%
印度
9.32%
俄罗斯
4.28%
德国
3.63%
地理流量分布全球图
同类开源产品
Spillmate
Spillmate是一个AI聊天机器人,专注于为年轻成年人、学生和专业人士提供压力和心理健康管理支持。
聊天机器人#认知行为疗法
1stroke
1Stroke是一款AI助手,能在网页任何文本框中生成有意义的回复,加快沟通速度。
聊天机器人#智能回复
Hive Chat
HiveChat 是一款专为中小型团队打造的 AI 聊天应用,支持多用户模式及权限管理,方便团队在协作中高效利用 AI 技术。
聊天机器人#团队协作
Puretalk.ai
Puretalk AI®提供智能响应式AI平台,从语音代理到聊天机器人,实现人类般流畅对话,提升满意度和简化运营。
聊天机器人#智能对话
Getbutton AI Chatbots For Websites
ChatGPT是一个基于网站内容训练的AI聊天机器人,可以24/7代表您与访客交流。
聊天机器人#客户服务
Parakeet Tdt 0.6b V2
parakeet-tdt-0.6b-v2 是一个 600 百万参数的自动语音识别(ASR)模型,旨在实现高质量的英语转录,具有准确的时间戳预测和自动标点符号、大小写支持。
语音识别#深度学习
Brutalgpt
BrutalGPT是一个提供直言不讳反馈的AI对话平台,用户可以通过与AI对话获取产品构想或个人反馈。
聊天机器人#反馈
SELPHO
Selpho提供AI技术驱动的医疗保健解决方案,包括MediDoc AI Chatbot、Vision DocScanner和AI Physician Handbook。
聊天机器人#medical AI
Qwen3
优质新品
Qwen3是通义千问团队推出的最新大型语言模型,旨在通过强大的思考和快速响应能力,为用户提供高效、灵活的解决方案。
聊天机器人
替代品
Parakeet Tdt 0.6b V2
parakeet-tdt-0.6b-v2 是一个 600 百万参数的自动语音识别(ASR)模型,旨在实现高质量的英语转录,具有准确的时间戳预测和自动标点符号、大小写支持。
语音识别#深度学习
Kimi Audio
Kimi-Audio 是一个先进的开源音频基础模型,旨在处理多种音频处理任务,如语音识别和音频对话。
语音识别#音频处理
Purechat
PureChat 是一款结合 AI 和前沿技术的现代聊天应用,采用 Vue3 和 ElementPlus 构建,内置 OpenAI、Ollama、DeepSeek 等大语言模型。
聊天机器人#AI
Openchat
优质新品
OpenChat 是一个现代化的全栈 AI 聊天应用,采用 React 和 Cloudflare Workers 构建,结合 Connect RPC 实现高效通信,通过 Tauri 支持多平台客户端。
聊天机器人#聊天
Open Multi Agent Canvas
Open Multi-Agent Canvas 是一个基于 Next.js、LangGraph 和 CopilotKit 构建的开源多智能体聊天界面。
聊天机器人#开源
Liteavatar
LiteAvatar是一个音频驱动的实时2D头像生成模型,主要用于实时聊天场景。
聊天机器人#虚拟头像
Deephermes 3 Llama 3 8B Preview
DeepHermes 3 是 NousResearch 开发的先进语言模型,能够通过系统性推理提升回答准确性。
聊天机器人#推理
Hivechat
HiveChat是一款面向中小团队的AI聊天应用,支持多种主流AI模型,如Deepseek、Open AI、Claude和Gemini等。
聊天机器人#团队协作
Step Audio
Step-Audio是首个生产级开源智能语音交互框架,整合了语音理解与生成能力,支持多语言对话、情感语调、方言、语速和韵律风格控制。
语音识别#多语言