开源OCR工具

OCRmyPDF开源项目 – 为PDF添加OCR文本层的开源工具

OCRmyPDF开源项目 – 为PDF添加OCR文本层的开源工具

OCRmyPDF 是一款功能强大的开源命令行工具，专为处理图像PDF文件而设计。它通过Tesseract OCR引擎为扫描的PDF文件添加OCR文本层，使其可搜索和复制。支持超过100种语言，并能生成符合PDF/A标准的文档，适合长期存储。OCRmyPDF 还优化PDF图像，减少文件大小，修复倾斜页面，并支持多核处理，适用于处理大批量PDF文件。

PDF OCR工具PDF/A生成图像优化开源OCR工具

Umi-OCR开源项目 – 高效离线的OCR文字识别工具

Umi-OCR开源项目 – 高效离线的OCR文字识别工具

Umi-OCR 是一款开源、免费且离线的OCR软件，专为识别和转换图像中的文本内容而设计。它支持多国语言识别，并提供多种文本后处理功能，如排版优化、忽略区域排除等。基于 Python 和 Qt 开发，Umi-OCR 拥有简洁直观的用户界面，支持截图识别、批量识别、PDF文档识别和二维码处理等功能。软件内置高效的离线OCR引擎，并支持通过插件扩展OCR能力，同时提供命令行和HTTP接口，方便开发者进行二次开发和集成。

PDF识别二维码处理多语言OCR开源OCR工具

Surya开源项目 – 多语言OCR与布局分析工具

Surya开源项目 – 多语言OCR与布局分析工具

Surya 是一款开源且强大的文档 OCR 工具，专注于文档图像的处理和分析。它支持 90 多种语言的文本检测与识别，包括中文、英文、日语、阿拉伯语等复杂语种。Surya 具备高效的布局分析能力，能够准确识别文档中的每一行文字，并支持复杂排版的阅读顺序检测。此外，它还支持表格、图像、标题等元素的检测，并且在非拉丁语系文档处理中表现优异，处理速度比 Tesseract 快 3 倍。

多语言文档OCR工具开源OCR工具文本识别文档图像处理

ImagenATexto官网 – 从图像中提取文本

ImagenATexto 是一个在线工具，允许用户通过简单的拖放操作，从图像中提取文本。该工具能够精确地识别和提取图像中的文本，适用于各种应用场景，帮助用户将图像内容转换为可编辑的文本格式。

图像文本提取工具在线文本转换工具高精度文本识别

Paperless-ngx开源项目 – 强大的在线文档管理系统

Paperless-ngx开源项目 – 强大的在线文档管理系统

一款功能强大的文档管理系统，能够将纸质文档转换成在线可搜索的文档，并进行分类和索引，方便随时搜索查阅。

OCR技术全文搜索多用户权限文档管理系统

Intics官网 – 加速文档处理，瞬间转化数据为见解

Intics是一款强大的文档处理工具，能够理解和捕捉任何格式的文本（包括印刷体和手写体）、表格、图片、商标、照片或地图。支持文档、PDF或图像等多种格式，助力用户快速提取信息并实现数据转化。

PDF处理信息提取手写体识别数据转化

PalyPDF官网 – 你的终极PDF助手

PalyPDF是一个易于使用的聊天应用，帮助用户存储和组织文件，支持与单个或多个PDF文件进行聊天，并提供语义、关键字和混合搜索功能。

PDF助手内容摘要实时聊天文件组织

iAsk官网 – 智能助手，快速解答问题

iAsk 是一个智能助手，能够回答有关您文件和链接的问题。用户只需在 Apple 设备上安装该应用并授权必要的权限，就可以使用语音、相机和图像来询问文件和链接的信息。

图片识别文件信息查询智能助手语音提问

TranslateImages官网 – 强大的图像翻译系统

TranslateImages是一个图像翻译系统，具有强大的编辑功能。它能够识别图像中的文本，清理背景并填入翻译后的文本。该系统保留原始图像的文本格式，如字体、颜色和位置，并提供编辑器用于微调。

图像编辑工具图像翻译系统多语言支持文本识别

screenpipe开源项目 – 个性化AI构建库

screenpipe开源项目 – 个性化AI构建库

一款强大可离线的开源 AI 桌面应用，能够对你的电脑进行 24 小时监控，通过屏幕录制、OCR、音频输入和转录收集信息，并保存到本地数据库。支持Ollama，替代Rewind.ai，数据归用户所有，使用Rust语言开发。

24小时电脑监控OCR支持个性化AI构建库屏幕录制

AI-magic收录了大量国内外AI工具箱，包括AI写作、图像、视频、音频、编程等各类AI工具，以及常用的AI学习、技术、和模型等信息，让你轻松加入人工智能浪潮。

Copyright © 2025 AI-magic 浙ICP备19008543号-3