Whisperfusion : AI实时对话，超低延迟

Whisperfusion

AI语音识别 AI语音助手 #AI #实时对话 #语音识别 #大型语言模型 #TensorRT 普通产品开源

简介 :

WhisperFusion是一款基于WhisperLive和WhisperSpeech功能的产品，通过在实时语音转文字流程中集成Mistral大型语言模型（LLM）来实现与AI的无缝对话。Whisper和LLM均经过TensorRT引擎优化，以最大程度提升性能和实时处理能力。WhisperSpeech则使用torch.compile来优化。产品定位于提供超低延迟的AI实时对话体验。

需求人群 :

用户可以通过使用预构建的TensorRT-LLM Docker容器快速开始与WhisperFusion进行交互。同时，也可以构建适用于不同cuda架构的docker镜像。

总访问量： 474.6M

占比最多地区： US(19.34%)

本站浏览量： 151.8K

使用场景

1. 在网站上与WhisperFusion的AI进行实时对话

2. 通过WhisperFusion的小程序进行语音转文字交互

3. 使用WhisperFusion插件在桌面客户端上进行实时语音识别

产品特色

实时语音转文字：利用OpenAI WhisperLive实现实时语音转文字。

大型语言模型集成：整合Mistral大型语言模型，增强对转录文本的理解和语境。