简介
AI-Powered Meeting Summarizer是一个基于Gradio的网站应用,能够将会议录音转换为文本,并使用whisper.cpp进行音频到文本的转换,以及Ollama服务器进行文本摘要。该工具非常适合快速提取会议中的关键点、决策和行动项目。
截图

产品特色
音频到文本转换:使用whisper.cpp将音频文件转换为文本。
文本摘要:使用Ollama服务器上的模型对文本进行摘要。
支持多种模型:支持不同的Whisper模型(基础版、小型、中型、大型V3)以及Ollama服务器上的任何可用模型。
翻译功能:允许将非英语音频翻译成英语。
Gradio界面:提供用户友好的Web界面,用于上传音频文件、查看摘要和下载文本。
要求Python 3.x环境:确保Python环境的兼容性和稳定性。
FFmpeg(用于音频处理):确保音频文件格式的兼容性。
Whisper.cpp(用于音频到文本转换):确保音频文件可以被准确转换。
Ollama服务器(用于文本摘要):确保文本摘要的准确性和效率。
Gradio(用于Web界面):确保用户界面的友好性和易用性。
Requests(用于处理Ollama服务器的API调用):确保API调用的稳定性和效率。
使用教程
步骤1:克隆仓库到本地。
步骤2:运行设置脚本,安装所有必要的依赖项(包括Python虚拟环境、whisper.cpp、FFmpeg和Python包),并运行应用程序。
步骤3:访问应用程序。完成设置和执行后,Gradio会提供一个URL(通常是http://127.0.0.1:7860)。在Web浏览器中打开此URL以访问会议摘要器界面。
步骤4:上传音频文件。点击音频上传区域并选择任何支持的格式(例如.wav、.mp3)的音频文件。
步骤5:提供额外的上下文(可选)。为了更好的摘要,可以提供额外的上下文(例如,“关于人工智能和伦理的会议”)。
步骤6:选择Whisper模型。从可用的Whisper模型(基础版、小型、中型、大型V3)中选择一个进行音频到文本的转换。
步骤7:选择摘要模型。从Ollama服务器提供的可用选项中选择一个模型。
步骤8:查看结果。上传音频文件后,你将获得由选定模型生成的摘要文本。
流量来源
直接访问 | 51.61% | 外链引荐 | 33.46% | 邮件 | 0.04% |
自然搜索 | 12.58% | 社交媒体 | 2.19% | 展示广告 | 0.11% |
最新流量情况
月访问量
4.92m
平均访问时长
393.01
每次访问页数
6.11
跳出率
36.20%
总流量趋势图
地理流量分布情况
美国
19.34%
中国
13.25%
印度
9.32%
俄罗斯
4.28%
德国
3.63%
地理流量分布全球图
同类开源产品

Semblian 2.0
Semblian 2.0是一个AI助手,旨在通过自动化和个性化的会议后行动建议,提高工作效率。
AI会议助手#自动化

Txt360
TxT360 是一个由 LLM360 提供的 Hugging Face 空间产品,专注于从海量文本数据中提取有价值的信息。
AI文本摘要工具#自然语言处理

AI Powered Meeting Summarizer
AI-Powered Meeting Summarizer是一个基于Gradio的网站应用,能够将会议录音转换为文本,并使用whisper.cpp进行音频到文本的转换,以及Ollama服务器进行文本摘要。
AI会议助手#文本摘要

Notebooklm Audio Overview
NotebookLM是一款帮助用户理解复杂信息的工具,通过摘要和提供相关引用来简化信息的获取。
AI文本摘要工具#音频讨论

Fellow.app
Fellow.app 是一款集成了人工智能技术的会议笔记与摘要工具,旨在帮助用户从会议中快速获取洞察并作出决策。
AI会议助手#AI摘要

Summarize (GPT 4o Or Gemini)
这个Chrome插件为选定的文本添加了一个右键菜单选项。
AI文本摘要工具#文本摘要

飞书妙记
飞书妙记是智能会议纪要工具,可将会议内容转录成易搜索、可翻译的逐字稿,自动总结会议纪要与待办事项,提升回顾和协作效率。
AI会议助手#会议纪要

Scribbl: AI Meeting Notes For Google Meet
Scribbl是一款针对Google Meet的AI会议笔记记录与生成工具。
AI会议助手#人工智能

Ghostmeet
GhostMeet是一个智能会议组织工具,通过Ghost Links、Trust Budgets和人工智能AI等功能,帮助用户优化会议流程、提高会议效率。
AI会议助手#组织
精选AI产品推荐

Nocode
中文精选
NoCode 是一款无需编程经验的平台,允许用户通过自然语言描述创意并快速生成应用,旨在降低开发门槛,让更多人能实现他们的创意。
开发平台#应用开发
912

Listenhub
优质新品
ListenHub 是一款轻量级的 AI 播客生成工具,支持中文和英语,基于前沿 AI 技术,能够快速生成用户感兴趣的播客内容。
音频生成#AI
348

Lovart
国外精选
Lovart 是一款革命性的 AI 设计代理,能够将创意提示转化为艺术作品,支持从故事板到品牌视觉的多种设计需求。
AI设计工具#创意工具
1,128

Fastvlm
FastVLM 是一种高效的视觉编码模型,专为视觉语言模型设计。
AI模型#图像处理开源
564

Smart PDFs
国外精选
Smart PDFs 是一个在线工具,利用 AI 技术快速分析 PDF 文档,并生成简明扼要的总结。
文章摘要#AI
984

Keysync
KeySync 是一个针对高分辨率视频的无泄漏唇同步框架。
视频编辑#视频处理开源
480

Anyvoice
AnyVoice是一款领先的AI声音生成器,采用先进的深度学习模型,将文本转换为与人类无法区分的自然语音。
音频生成#文本转语音
26.38k

Liblibai
中文精选
LiblibAI是一个中国领先的AI创作平台,提供强大的AI创作能力,帮助创作者实现创意。
AI模型#图像生成
344.42k