简介
SpeechGPT 2.0-preview 是一款由复旦大学自然语言处理实验室开发的先进语音交互模型。它通过海量语音数据训练,实现了低延迟、高自然度的语音交互能力。该模型能够模拟多种情感、风格和角色的语音表达,同时支持工具调用、在线搜索和外部知识库访问等功能。其主要优点包括强大的语音风格泛化能力、多角色模拟以及低延迟交互体验。目前该模型仅支持中文语音交互,未来计划扩展到更多语言。
截图

产品特色
支持多情感、多风格、多语调的语音交互,可智能切换。
具备强大的角色扮演能力,能够模拟不同角色的语音和情感状态。
支持工具调用、在线搜索和外部知识库访问,提升交互智能性。
低延迟交互,延迟低于200毫秒,提供流畅的实时体验。
支持诗歌朗诵、讲故事、方言对话等多种语音才能。
通过语义-声学联合建模,实现超低比特率的流式语音编解码。
采用混合语音-文本建模架构,平衡语音和文本处理能力。
提供开源的推理代码、模型权重和方法介绍,方便开发者使用。
使用教程
访问 [Demo 页面](https://sp2.open-moss.com/),体验语音交互功能。
在 GitHub 上查看开源代码和模型权重,了解技术细节。
根据需求选择适合的语音交互模式,如多情感、多风格等。
通过语音输入与模型进行实时交互,体验低延迟响应。
利用模型的工具调用和搜索功能,获取更丰富的交互内容。
根据实际应用场景,结合模型能力进行二次开发或集成。
流量来源
直接访问 | 43.15% | 外链引荐 | 9.21% | 邮件 | 0.04% |
自然搜索 | 37.60% | 社交媒体 | 9.08% | 展示广告 | 0.92% |
最新流量情况
月访问量
800
平均访问时长
0.00
每次访问页数
1.03
跳出率
42.10%
总流量趋势图
地理流量分布情况
美国
100.00%
地理流量分布全球图
同类开源产品

Spillmate
Spillmate是一个AI聊天机器人,专注于为年轻成年人、学生和专业人士提供压力和心理健康管理支持。
聊天机器人#认知行为疗法

1stroke
1Stroke是一款AI助手,能在网页任何文本框中生成有意义的回复,加快沟通速度。
聊天机器人#智能回复

Hive Chat
HiveChat 是一款专为中小型团队打造的 AI 聊天应用,支持多用户模式及权限管理,方便团队在协作中高效利用 AI 技术。
聊天机器人#团队协作

Puretalk.ai
Puretalk AI®提供智能响应式AI平台,从语音代理到聊天机器人,实现人类般流畅对话,提升满意度和简化运营。
聊天机器人#智能对话

Getbutton AI Chatbots For Websites
ChatGPT是一个基于网站内容训练的AI聊天机器人,可以24/7代表您与访客交流。
聊天机器人#客户服务

Brutalgpt
BrutalGPT是一个提供直言不讳反馈的AI对话平台,用户可以通过与AI对话获取产品构想或个人反馈。
聊天机器人#反馈

SELPHO
Selpho提供AI技术驱动的医疗保健解决方案,包括MediDoc AI Chatbot、Vision DocScanner和AI Physician Handbook。
聊天机器人#medical AI

Qwen3
优质新品
Qwen3是通义千问团队推出的最新大型语言模型,旨在通过强大的思考和快速响应能力,为用户提供高效、灵活的解决方案。
聊天机器人

Athenaiq
Athena IQ是一款智能问答系统,通过训练数据并快速部署聊天机器人,帮助企业提供快速准确的答案,节省时间和精力。
聊天机器人#自动化
替代品

Purechat
PureChat 是一款结合 AI 和前沿技术的现代聊天应用,采用 Vue3 和 ElementPlus 构建,内置 OpenAI、Ollama、DeepSeek 等大语言模型。
聊天机器人#AI

Openchat
优质新品
OpenChat 是一个现代化的全栈 AI 聊天应用,采用 React 和 Cloudflare Workers 构建,结合 Connect RPC 实现高效通信,通过 Tauri 支持多平台客户端。
聊天机器人#聊天

Open Multi Agent Canvas
Open Multi-Agent Canvas 是一个基于 Next.js、LangGraph 和 CopilotKit 构建的开源多智能体聊天界面。
聊天机器人#开源

Liteavatar
LiteAvatar是一个音频驱动的实时2D头像生成模型,主要用于实时聊天场景。
聊天机器人#虚拟头像

Deephermes 3 Llama 3 8B Preview
DeepHermes 3 是 NousResearch 开发的先进语言模型,能够通过系统性推理提升回答准确性。
聊天机器人#推理

Hivechat
HiveChat是一款面向中小团队的AI聊天应用,支持多种主流AI模型,如Deepseek、Open AI、Claude和Gemini等。
聊天机器人#团队协作

Gemini Pro Chatbot
Gemini Pro Chatbot 是一款基于 Google Gemini Pro AI 模型开发的移动聊天应用。
聊天机器人#聊天

Deepseek Project
DeepSeek Project 是一个综合性技术项目,旨在通过集成 DeepSeek API 提供多种功能。
聊天机器人#聊天机器人

Podscript
Podscript 是一个强大的音频转录工具,它利用语言模型和语音到文本(STT)API,为播客和其他音频内容生成高质量的转录文本。
语音转文本#播客
精选AI产品推荐

Nocode
中文精选
NoCode 是一款无需编程经验的平台,允许用户通过自然语言描述创意并快速生成应用,旨在降低开发门槛,让更多人能实现他们的创意。
开发平台#应用开发
912

Listenhub
优质新品
ListenHub 是一款轻量级的 AI 播客生成工具,支持中文和英语,基于前沿 AI 技术,能够快速生成用户感兴趣的播客内容。
音频生成#AI
348

Lovart
国外精选
Lovart 是一款革命性的 AI 设计代理,能够将创意提示转化为艺术作品,支持从故事板到品牌视觉的多种设计需求。
AI设计工具#创意工具
1,128

Fastvlm
FastVLM 是一种高效的视觉编码模型,专为视觉语言模型设计。
AI模型#图像处理开源
564

Smart PDFs
国外精选
Smart PDFs 是一个在线工具,利用 AI 技术快速分析 PDF 文档,并生成简明扼要的总结。
文章摘要#AI
984

Keysync
KeySync 是一个针对高分辨率视频的无泄漏唇同步框架。
视频编辑#视频处理开源
480

Anyvoice
AnyVoice是一款领先的AI声音生成器,采用先进的深度学习模型,将文本转换为与人类无法区分的自然语音。
音频生成#文本转语音
26.38k

Liblibai
中文精选
LiblibAI是一个中国领先的AI创作平台,提供强大的AI创作能力,帮助创作者实现创意。
AI模型#图像生成
344.42k