# PDF处理
Olmocr
olmOCR是由Allen Institute for Artificial Intelligence (AI2)开发的一个开源工具包,旨在将PDF文档线性化,以便用于大型语言模型(LLM)的训练。
开发与工具#LLM训练开源
1,812
Kreuzberg
Kreuzberg是一个现代Python库,专注于从各种文档中提取文本。
开发与工具#PDF处理开源
1,488
Trellis AI
Trellis是一款面向企业和专业团队的PDF工作流自动化平台。
自动化工作流#PDF处理
384
Ollama Ebook Summary
ollama-ebook-summary 是一个利用大型语言模型(LLM)为长文本创建要点笔记摘要的项目。
#自动化开源
1,200
Tabled
Tabled是一个用于检测和提取表格的Python库,它使用surya来识别PDF中的表格,识别行列,并能够将单元格格式化为Markdown、CSV或HTML。
AI数据挖掘#PDF处理开源
1,152
Pdftochat
国外精选
PDFtoChat是一个允许用户与PDF文件进行对话的平台。
AI聊天机器人#人工智能
720
Swift Ocr Llm Powered Pdf To Markdown
这是一个开源的OCR API,利用OpenAI强大的语言模型和优化的性能技术(如并行处理和批处理)来实现从复杂PDF文档中提取高质量文本。
AI文档工具#PDF处理开源
528
Datalab.to
Datalab 的 AI For Document Intelligence 是一系列用于文档智能处理的AI模型,包括OCR、布局分析、PDF转Markdown等。
开发与工具#OCR
792
Gmft
gmft是一个用于将PDF中的表格转换为多种格式的工具包。
AI工具网址目录#表格提取开源
540
Docsolver
优质新品
DocSolver是一个利用GPT-4 API技术构建的聊天机器人,专为处理和分析大型PDF文件设计。
聊天机器人#PDF处理
936
Google Bard PDF Mastery Guide
Google Bard's PDF Top Guide是一份免费的终极资源,帮助用户充分利用Google Bard的PDF上传功能。
AI信息平台#PDF处理
840
PDF Candy
PDF Candy是一款提供免费PDF转换和其他PDF工具的在线服务。
开发与工具#在线工具
1,836