基于Rust语言实现的多语言文档OCR工具包,结合修改版Segformer、OpenCV和donut transformer,提供高效的文档识别与处理功能。
Surya 是一款开源且强大的文档 OCR 工具,专注于文档图像的处理和分析。它支持 90 多种语言的文本检测与识别,包括中文、英文、日语、阿拉伯语等复杂语种。Surya 具备高效的布局分析能力,能够准确识别文档中的每一行文字,并支持复杂排版的阅读顺序检测。此外,它还支持表格、图像、标题等元素的检测,并且在非拉丁语系文档处理中表现优异,处理速度比 Tesseract 快 3 倍。
ImagenATexto 是一个在线工具,允许用户通过简单的拖放操作,从图像中提取文本。该工具能够精确地识别和提取图像中的文本,适用于各种应用场景,帮助用户将图像内容转换为可编辑的文本格式。
一款功能强大的文档管理系统,能够将纸质文档转换成在线可搜索的文档,并进行分类和索引,方便随时搜索查阅。
Intics是一款强大的文档处理工具,能够理解和捕捉任何格式的文本(包括印刷体和手写体)、表格、图片、商标、照片或地图。支持文档、PDF或图像等多种格式,助力用户快速提取信息并实现数据转化。
PalyPDF是一个易于使用的聊天应用,帮助用户存储和组织文件,支持与单个或多个PDF文件进行聊天,并提供语义、关键字和混合搜索功能。
iAsk 是一个智能助手,能够回答有关您文件和链接的问题。用户只需在 Apple 设备上安装该应用并授权必要的权限,就可以使用语音、相机和图像来询问文件和链接的信息。
TranslateImages是一个图像翻译系统,具有强大的编辑功能。它能够识别图像中的文本,清理背景并填入翻译后的文本。该系统保留原始图像的文本格式,如字体、颜色和位置,并提供编辑器用于微调。
一款强大可离线的开源 AI 桌面应用,能够对你的电脑进行 24 小时监控,通过屏幕录制、OCR、音频输入和转录收集信息,并保存到本地数据库。支持Ollama,替代Rewind.ai,数据归用户所有,使用Rust语言开发。