Ollama Ebook Summary
Ollama Ebook Summary
目标受众为需要处理大量文本信息的用户,如作家、研究人员、学生或任何需要从长文本中快速提取信息的专业人士。该工具适合他们,因为它可以大幅减少手动总结书籍和长文本的时间,提高工作效率。
总访问量: 474,564,576
占比最多地区: US(19.34%)
1,188
简介
ollama-ebook-summary 是一个利用大型语言模型(LLM)为长文本创建要点笔记摘要的项目。该项目特别适用于epub和pdf格式的书籍,能够自动化提取章节并将其分割成约2000个token的小块,以提高响应的粒度。产品背景是创建者希望快速总结一系列书籍,以整合心理学理论和实践,并基于此信息构建连贯的论点。该工具的主要优点包括提高内容梳理效率、支持自定义问题查询、以及生成每个文本部分的详细摘要。
截图
产品特色
自动化提取书籍章节并分割成小块:能够处理epub和pdf格式,自动提取章节并分割成易于处理的小块。
生成要点笔记摘要:对每个文本块生成要点笔记,包括加粗的标题和术语。
支持自定义问题查询:用户可以对文本的每个部分提出问题,获得更具体的信息。
支持多种模型使用:包括Ollama和HuggingFace提供的模型,用户可以根据需要选择合适的模型。
输出格式化文本:支持输出为CSV或Markdown格式,方便用户进一步处理和查看。
支持长文本处理:特别适用于长文本,如电子书,能够处理大量文本并生成摘要。
自定义配置文件:用户可以根据需要更新配置文件,以适应不同的摘要需求。
使用教程
1. 确保已安装Python 3.11.9环境。
2. 安装项目依赖,通过命令`pip install -r requirements.txt`。
3. 下载并设置所需的模型,使用Ollama或HuggingFace。
4. 更新配置文件`_config.yaml`,设置默认的prompt和模型。
5. 使用脚本`python3 book2text.py ebook-name.epub`将电子书转换为分块的CSV或TXT文件。
6. 运行`python3 sum.py -c ebook-name_processed.csv`生成摘要。
7. 查看生成的Markdown或CSV文件,获取书籍的要点笔记摘要。
流量来源
直接访问51.61%外链引荐33.46%邮件0.04%
自然搜索12.58%社交媒体2.19%展示广告0.11%
最新流量情况
月访问量
4.92m
平均访问时长
393.01
每次访问页数
6.11
跳出率
36.20%
总流量趋势图
地理流量分布情况
美国
19.34%
中国
13.25%
印度
9.32%
俄罗斯
4.28%
德国
3.63%
地理流量分布全球图