简介
Home Assistant Voice Preview Edition是一款开源、注重隐私的语音助手硬件产品,旨在提供一种开放、本地化、私人化的语音控制解决方案。它允许用户通过语音控制家中的智能设备,同时确保用户的语音数据不会离开本地网络,保护用户隐私。该产品背景是响应对隐私保护日益增长的需求,特别是在智能家居领域。价格方面,产品定价为59美元,推荐零售价,具体价格可能会因零售商而异。
截图

产品特色
先进音频处理:双麦克风和XMOS音频芯片,能在多种环境下清晰接收语音指令。
物理静音开关:可物理切断麦克风电源,确保隐私。
物理控制:按钮和旋转音量旋钮,提供良好的触感反馈。
扬声器:可跨房间听到的音频反馈。
视觉反馈:多色LED环显示监听状态和音量级别。
音频输出:3.5mm立体声插孔,可通过专用DAC播放无损音质音乐。
注塑成型外壳:小巧、不显眼的设计,可融入家居环境。
使用教程
1. 连接设备:使用USB-C线将Home Assistant Voice Preview Edition连接到电源。
2. 设备配对:通过Home Assistant的设置向导完成设备的配对和初步设置。
3. 语音控制:使用预设的唤醒词激活设备,如'Okay Nabu',然后发出语音指令。
4. 调整设置:根据需要在Home Assistant中调整设备设置,如音量、唤醒词等。
5. 扩展功能:利用Grove端口连接传感器或其他配件,增强设备的功能性。
6. 固件更新:定期检查并更新ESPHome固件,以获得最新功能和安全更新。
7. 隐私保护:使用物理静音开关在不需要监听时切断麦克风电源,保护隐私。
流量来源
直接访问 | 54.36% | 外链引荐 | 38.28% | 邮件 | 0.06% |
自然搜索 | 6.44% | 社交媒体 | 0.82% | 展示广告 | 0.05% |
最新流量情况
月访问量
5374.95k
平均访问时长
318.65
每次访问页数
5.68
跳出率
37.27%
总流量趋势图
地理流量分布情况
美国
22.17%
德国
17.10%
英国
4.75%
荷兰
4.70%
中国
4.55%
地理流量分布全球图
同类开源产品

Overhyped AI
Overhyped AI是一种AI语音代理,旨在提高产品采纳率。
个人助理#AI技术

Goonj
Goonj是一款宝宝哭声分析应用,利用人工智能分析宝宝哭声,并在5秒内准确告诉您宝宝哭泣的原因。
个人助理#健康

Minimax Agent
MiniMax Agent是一款智能AI伴侣,采用最新的多模态技术。
个人助理#多模态技术

ODYSSEA
ODYSSEA是一款旨在帮助用户更好地了解自己生活的应用程序。
个人助理#数据分析

Agentcpm GUI
AgentCPM-GUI 是一款开源的手机端大型语言模型(LLM)代理,专为操作中英文应用程序而设计,能够根据用户的屏幕截图自动执行任务。
个人助理#智能代理

Sked
Sked是一个AI日程安排助手,通过AI自动找到所有人最适合的时间,帮助结束Slack中的日程混乱。
个人助理#Slack集成

Sobo AI
Sobo是一款AI助理个性化训练应用,结合先进的人工智能技术和成熟的健身原则,为用户提供定制化的训练体验。
个人助理#健身计划

Omigpt
Omi AI是一款个人AI助手,具备监听、记录对话、记笔记、执行任务的功能。
个人助理#记忆辅助

Parakeet Tdt 0.6b V2
parakeet-tdt-0.6b-v2 是一个 600 百万参数的自动语音识别(ASR)模型,旨在实现高质量的英语转录,具有准确的时间戳预测和自动标点符号、大小写支持。
语音识别#深度学习
替代品

Agentcpm GUI
AgentCPM-GUI 是一款开源的手机端大型语言模型(LLM)代理,专为操作中英文应用程序而设计,能够根据用户的屏幕截图自动执行任务。
个人助理#智能代理

Parakeet Tdt 0.6b V2
parakeet-tdt-0.6b-v2 是一个 600 百万参数的自动语音识别(ASR)模型,旨在实现高质量的英语转录,具有准确的时间戳预测和自动标点符号、大小写支持。
语音识别#深度学习

Kimi Audio
Kimi-Audio 是一个先进的开源音频基础模型,旨在处理多种音频处理任务,如语音识别和音频对话。
语音识别#音频处理

Suna
Suna 是一个开源的 AI 助手,通过自然对话帮助用户轻松完成研究、数据分析和日常挑战。
个人助理#开源

TEN Agent
国外精选
TEN Agent 是基于 TEN 框架构建的实时对话 AI引擎,为开发者提供快速、高效的工具来构建实时对话式 AI Agent,如AI虚拟客服、AI 口语陪练、AI 情感陪伴、AI 个人助理等。
个人助理#Voice Agent

Egolife
EgoLife是一个面向长期、多模态、多视角日常生活的AI助手项目。
个人助理#多模态

Step Audio
Step-Audio是首个生产级开源智能语音交互框架,整合了语音理解与生成能力,支持多语言对话、情感语调、方言、语速和韵律风格控制。
语音识别#多语言

Fireredasr AED L
FireRedASR-AED-L 是一个开源的工业级自动语音识别模型,专为满足高效率和高性能的语音识别需求而设计。
语音识别#开源

Fireredasr
FireRedASR 是一个开源的工业级普通话自动语音识别模型,采用 Encoder-Decoder 和 LLM 集成架构。
语音识别#人工智能
精选AI产品推荐

Nocode
中文精选
NoCode 是一款无需编程经验的平台,允许用户通过自然语言描述创意并快速生成应用,旨在降低开发门槛,让更多人能实现他们的创意。
开发平台#应用开发
912

Listenhub
优质新品
ListenHub 是一款轻量级的 AI 播客生成工具,支持中文和英语,基于前沿 AI 技术,能够快速生成用户感兴趣的播客内容。
音频生成#AI
348

Lovart
国外精选
Lovart 是一款革命性的 AI 设计代理,能够将创意提示转化为艺术作品,支持从故事板到品牌视觉的多种设计需求。
AI设计工具#创意工具
1,128

Fastvlm
FastVLM 是一种高效的视觉编码模型,专为视觉语言模型设计。
AI模型#图像处理开源
564

Smart PDFs
国外精选
Smart PDFs 是一个在线工具,利用 AI 技术快速分析 PDF 文档,并生成简明扼要的总结。
文章摘要#AI
984

Keysync
KeySync 是一个针对高分辨率视频的无泄漏唇同步框架。
视频编辑#视频处理开源
480

Anyvoice
AnyVoice是一款领先的AI声音生成器,采用先进的深度学习模型,将文本转换为与人类无法区分的自然语音。
音频生成#文本转语音
26.38k

Liblibai
中文精选
LiblibAI是一个中国领先的AI创作平台,提供强大的AI创作能力,帮助创作者实现创意。
AI模型#图像生成
344.42k