OCRmyPDF 是一款功能强大的开源命令行工具,专为处理图像PDF文件而设计。它通过Tesseract OCR引擎为扫描的PDF文件添加OCR文本层,使其可搜索和复制。支持超过100种语言,并能生成符合PDF/A标准的文档,适合长期存储。OCRmyPDF 还优化PDF图像,减少文件大小,修复倾斜页面,并支持多核处理,适用于处理大批量PDF文件。
Umi-OCR 是一款开源、免费且离线的OCR软件,专为识别和转换图像中的文本内容而设计。它支持多国语言识别,并提供多种文本后处理功能,如排版优化、忽略区域排除等。基于 Python 和 Qt 开发,Umi-OCR 拥有简洁直观的用户界面,支持截图识别、批量识别、PDF文档识别和二维码处理等功能。软件内置高效的离线OCR引擎,并支持通过插件扩展OCR能力,同时提供命令行和HTTP接口,方便开发者进行二次开发和集成。
Surya 是一款开源且强大的文档 OCR 工具,专注于文档图像的处理和分析。它支持 90 多种语言的文本检测与识别,包括中文、英文、日语、阿拉伯语等复杂语种。Surya 具备高效的布局分析能力,能够准确识别文档中的每一行文字,并支持复杂排版的阅读顺序检测。此外,它还支持表格、图像、标题等元素的检测,并且在非拉丁语系文档处理中表现优异,处理速度比 Tesseract 快 3 倍。
ImagenATexto 是一个在线工具,允许用户通过简单的拖放操作,从图像中提取文本。该工具能够精确地识别和提取图像中的文本,适用于各种应用场景,帮助用户将图像内容转换为可编辑的文本格式。
一款功能强大的文档管理系统,能够将纸质文档转换成在线可搜索的文档,并进行分类和索引,方便随时搜索查阅。
Intics是一款强大的文档处理工具,能够理解和捕捉任何格式的文本(包括印刷体和手写体)、表格、图片、商标、照片或地图。支持文档、PDF或图像等多种格式,助力用户快速提取信息并实现数据转化。
PalyPDF是一个易于使用的聊天应用,帮助用户存储和组织文件,支持与单个或多个PDF文件进行聊天,并提供语义、关键字和混合搜索功能。
iAsk 是一个智能助手,能够回答有关您文件和链接的问题。用户只需在 Apple 设备上安装该应用并授权必要的权限,就可以使用语音、相机和图像来询问文件和链接的信息。
TranslateImages是一个图像翻译系统,具有强大的编辑功能。它能够识别图像中的文本,清理背景并填入翻译后的文本。该系统保留原始图像的文本格式,如字体、颜色和位置,并提供编辑器用于微调。
一款强大可离线的开源 AI 桌面应用,能够对你的电脑进行 24 小时监控,通过屏幕录制、OCR、音频输入和转录收集信息,并保存到本地数据库。支持Ollama,替代Rewind.ai,数据归用户所有,使用Rust语言开发。