MinerU 是由上海人工智能实验室开发的智能文档处理工具,专为 RAG(检索增强生成)项目设计。它能够高效解析 PDF 文档,支持多种文档类型转换,如考题、PPT、论文、教科书等,并支持多语言识别和多种元素解析。MinerU 具备删除页眉、页脚、脚注等功能,并能将图片和表格转换为多模态 Markdown 格式。它兼容 Windows、Linux 和 Mac 平台,并支持 CPU、GPU、NPU 加速,适用于大规模文档处理。