DevDocs是由CyberAGI开发的开源文档处理工具,专为开发者设计,能够自动爬取、解析和组织技术文档内容。 它通过智能爬虫技术将分散的文档转化为结构化数据,大幅降低技术调研时间。项目内置MCP服务器,支持与Claude等AI工具集成, 提供对话式文档查询体验,支持Docker快速部署,适用于企业团队、独立开发者等多种场景。
MinerU 是由上海人工智能实验室开发的智能文档处理工具,专为 RAG(检索增强生成)项目设计。它能够高效解析 PDF 文档,支持多种文档类型转换,如考题、PPT、论文、教科书等,并支持多语言识别和多种元素解析。MinerU 具备删除页眉、页脚、脚注等功能,并能将图片和表格转换为多模态 Markdown 格式。它兼容 Windows、Linux 和 Mac 平台,并支持 CPU、GPU、NPU 加速,适用于大规模文档处理。