PDF Craft是一个专注于处理扫描书籍PDF的开源工具,能将PDF文件高效转换为Markdown或EPUB格式。 它通过本地AI模型(如DocLayout-YOLO、OnnxOCR)实现文本提取、页眉页脚过滤、跨页文本衔接, 并支持集成LLM(如DeepSeek)进行书籍结构化处理、OCR纠错和注释优化。适合论文、书籍等文档转换, 提供从本地处理到云端LLM协同的多层次解决方案。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型