LLM辅助OCR工具

LLM-Aided OCR开源项目 – 提升OCR扫描PDF的文本质量

LLM-Aided OCR开源项目 – 提升OCR扫描PDF的文本质量

LLM-Aided OCR 是一个基于大型语言模型（LLM）的开源工具，旨在通过结合光学字符识别（OCR）和LLM的纠错功能，将扫描的PDF文件转换为高准确度、格式正确且易于阅读的Markdown文档。该工具支持多种大语言模型的集成，包括本地LLM和云端API，适用于需要将扫描文档高质量数字化的场景。

LLM辅助OCR工具PDF转Markdown开源项目文本提取

surya-rs开源项目 – 多语言文档OCR工具包

surya-rs开源项目 – 多语言文档OCR工具包

基于Rust语言实现的多语言文档OCR工具包，结合修改版Segformer、OpenCV和donut transformer，提供高效的文档识别与处理功能。

OpenCVRust语言实现多语言文档OCR工具文档布局分析

RAGLite开源项目 – 轻量级Python RAG工具包

RAGLite开源项目 – 轻量级Python RAG工具包

RAGLite是一个轻量级的Python RAG工具包，支持PostgreSQL和SQLite作为向量数据库，旨在提供高效的信息检索和生成解决方案。

ChatGPT前端构建PDF转MarkdownPython RAG工具信息检索

gptpdf开源项目 – 使用GPT解析和分析PDF文件

gptpdf开源项目 – 使用GPT解析和分析PDF文件

gptpdf是一个利用GPT技术来解析和分析PDF文件的工具，能够将PDF内容转换为Markdown格式，支持复杂排版、数学公式、表格、图片和图表的完美解析。

GPT技术markdown转换PDF解析工具图表解析

imgProof官网 – AI图像文本校对工具

imgProof是一个基于AI的工具，能够分析图像文件中的文本，识别拼写和语法错误，提供修正建议。

AI文本识别图像文本校对工具拼写和语法错误修正

AI-magic收录了大量国内外AI工具箱，包括AI写作、图像、视频、音频、编程等各类AI工具，以及常用的AI学习、技术、和模型等信息，让你轻松加入人工智能浪潮。

Copyright © 2025 AI-magic 浙ICP备19008543号-3