简介
Sesame 是一个专注于语音技术的跨学科产品和研究团队,旨在通过自然语音交互,让用户与计算机的交互更加自然和高效。其主要产品包括个人语音伴侣和轻量级可穿戴眼镜设备,旨在实现计算机的拟人化,帮助用户更好地组织信息、提升效率。产品的主要优点是语音交互的自然性和设备的便携性,适合日常使用。目前,Sesame 正在积极招聘,致力于推动语音技术的创新。
截图

产品特色
提供自然语音交互,让计算机像人类一样与用户对话
作为个人伴侣,帮助用户保持信息更新和组织日常事务
通过轻量级眼镜设备,为用户提供高质量音频和全天候陪伴
观察用户周围环境,提供实时反馈和交互
支持语音交互的演示和研究,推动语音技术的发展
提供跨学科的研究和开发,探索语音技术的未来
通过语音技术跨越'恐怖谷',提升交互体验
使用教程
1. 访问 Sesame 官方网站,了解产品详情和演示。
2. 下载 Sesame APP 或注册研究演示,体验语音交互功能。
3. 配戴轻量级眼镜设备,连接APP以获取高质量音频和语音交互支持。
4. 使用语音命令与Sesame交互,获取信息或完成任务。
5. 参与Sesame的研究项目,提供反馈以帮助改进产品。
流量来源
直接访问 | 57.35% | 外链引荐 | 18.21% | 邮件 | 0.12% |
自然搜索 | 4.42% | 社交媒体 | 19.49% | 展示广告 | 0.41% |
最新流量情况
月访问量
5114.06k
平均访问时长
235.51
每次访问页数
2.78
跳出率
47.91%
总流量趋势图
地理流量分布情况
美国
25.42%
越南
7.71%
印度
5.25%
英国
3.83%
加拿大
3.57%
地理流量分布全球图
同类开源产品

Overhyped AI
Overhyped AI是一种AI语音代理,旨在提高产品采纳率。
个人助理#AI技术

Goonj
Goonj是一款宝宝哭声分析应用,利用人工智能分析宝宝哭声,并在5秒内准确告诉您宝宝哭泣的原因。
个人助理#健康

Minimax Agent
MiniMax Agent是一款智能AI伴侣,采用最新的多模态技术。
个人助理#多模态技术

ODYSSEA
ODYSSEA是一款旨在帮助用户更好地了解自己生活的应用程序。
个人助理#数据分析

Agentcpm GUI
AgentCPM-GUI 是一款开源的手机端大型语言模型(LLM)代理,专为操作中英文应用程序而设计,能够根据用户的屏幕截图自动执行任务。
个人助理#智能代理

Sked
Sked是一个AI日程安排助手,通过AI自动找到所有人最适合的时间,帮助结束Slack中的日程混乱。
个人助理#Slack集成

Sobo AI
Sobo是一款AI助理个性化训练应用,结合先进的人工智能技术和成熟的健身原则,为用户提供定制化的训练体验。
个人助理#健身计划

Omigpt
Omi AI是一款个人AI助手,具备监听、记录对话、记笔记、执行任务的功能。
个人助理#记忆辅助

Parakeet Tdt 0.6b V2
parakeet-tdt-0.6b-v2 是一个 600 百万参数的自动语音识别(ASR)模型,旨在实现高质量的英语转录,具有准确的时间戳预测和自动标点符号、大小写支持。
语音识别#深度学习
替代品

Agentcpm GUI
AgentCPM-GUI 是一款开源的手机端大型语言模型(LLM)代理,专为操作中英文应用程序而设计,能够根据用户的屏幕截图自动执行任务。
个人助理#智能代理

Parakeet Tdt 0.6b V2
parakeet-tdt-0.6b-v2 是一个 600 百万参数的自动语音识别(ASR)模型,旨在实现高质量的英语转录,具有准确的时间戳预测和自动标点符号、大小写支持。
语音识别#深度学习

Kimi Audio
Kimi-Audio 是一个先进的开源音频基础模型,旨在处理多种音频处理任务,如语音识别和音频对话。
语音识别#音频处理

Suna
Suna 是一个开源的 AI 助手,通过自然对话帮助用户轻松完成研究、数据分析和日常挑战。
个人助理#开源

TEN Agent
国外精选
TEN Agent 是基于 TEN 框架构建的实时对话 AI引擎,为开发者提供快速、高效的工具来构建实时对话式 AI Agent,如AI虚拟客服、AI 口语陪练、AI 情感陪伴、AI 个人助理等。
个人助理#Voice Agent

Egolife
EgoLife是一个面向长期、多模态、多视角日常生活的AI助手项目。
个人助理#多模态

Step Audio
Step-Audio是首个生产级开源智能语音交互框架,整合了语音理解与生成能力,支持多语言对话、情感语调、方言、语速和韵律风格控制。
语音识别#多语言

Fireredasr AED L
FireRedASR-AED-L 是一个开源的工业级自动语音识别模型,专为满足高效率和高性能的语音识别需求而设计。
语音识别#开源

Fireredasr
FireRedASR 是一个开源的工业级普通话自动语音识别模型,采用 Encoder-Decoder 和 LLM 集成架构。
语音识别#人工智能
精选AI产品推荐

Nocode
中文精选
NoCode 是一款无需编程经验的平台,允许用户通过自然语言描述创意并快速生成应用,旨在降低开发门槛,让更多人能实现他们的创意。
开发平台#应用开发
912

Listenhub
优质新品
ListenHub 是一款轻量级的 AI 播客生成工具,支持中文和英语,基于前沿 AI 技术,能够快速生成用户感兴趣的播客内容。
音频生成#AI
348

Lovart
国外精选
Lovart 是一款革命性的 AI 设计代理,能够将创意提示转化为艺术作品,支持从故事板到品牌视觉的多种设计需求。
AI设计工具#创意工具
1,128

Fastvlm
FastVLM 是一种高效的视觉编码模型,专为视觉语言模型设计。
AI模型#图像处理开源
564

Smart PDFs
国外精选
Smart PDFs 是一个在线工具,利用 AI 技术快速分析 PDF 文档,并生成简明扼要的总结。
文章摘要#AI
984

Keysync
KeySync 是一个针对高分辨率视频的无泄漏唇同步框架。
视频编辑#视频处理开源
480

Anyvoice
AnyVoice是一款领先的AI声音生成器,采用先进的深度学习模型,将文本转换为与人类无法区分的自然语音。
音频生成#文本转语音
26.38k

Liblibai
中文精选
LiblibAI是一个中国领先的AI创作平台,提供强大的AI创作能力,帮助创作者实现创意。
AI模型#图像生成
344.42k