金鸣在线表格识别系统是由深圳市金鸣科技有限公司提供的在线OCR服务,专为将图像中的表格转换为可编辑的Excel文件而设计。该系统利用百度文心一言大模型等先进AI技术,提供高精度的表格识别、文本识别和图像校正功能,支持批量处理和多种文档格式的转换。适用于需要快速、高效文档数字化的企业和个人用户。
Doc2X 是由 NoEdgeAI 开发的一个先进的 AI 驱动文档解析工具,专注于从 PDF 文件中提取和转换复杂元素,如表格和公式。它特别适合处理学术论文、财务报告和教育材料等复杂文档。支持多种格式转换和多语言翻译,具有高精度识别和批量处理功能。
TextIn 是一款专业的智能文档解析工具,专注于处理电子文档、图片和扫描件。它采用先进的深度学习算法,能够高精度解析多种格式的文档,包括 PDF、DOCX、XLSX、JPG、PNG 等,甚至能处理手写笔记和复杂图表。TextIn 支持多语言识别,并能智能分析笔记版面,区分标题、正文、图表等元素,确保识别结果的逻辑性和可读性。
EasyWatermark 是一个开源项目,旨在帮助用户安全、轻松地为敏感照片添加水印,防止照片被泄露或滥用。项目完全离线运行,无需担心照片泄露问题,支持多种水印样式和透明度设置,允许用户自定义水印文本和位置,提供了简单易用的图形用户界面(GUI),并支持批量处理。
Image Toolbox 是一个功能强大的图像处理工具,专为高效的照片编辑和操作而设计。它提供了丰富的功能,包括图像裁剪、滤镜应用、EXIF数据编辑、背景去除、图像转换为PDF等。无论是摄影师还是开发者,都可以通过其简洁的界面轻松完成复杂的图像处理任务。项目基于Kotlin开发,支持Android平台,并提供了多种高级功能,如批量处理、自定义滤镜、图像拼接、背景去除、水印添加、图像绘制等。
docling-api是一个高效、可扩展的文档转换后端服务器,能够轻松将多种文档格式(如PDF、DOCX、PPTX、HTML、图片等)转换为Markdown格式。它支持CPU和GPU处理,尤其在GPU模式下性能显著提升。该API提供同步和异步接口,满足不同场景需求,并支持多语言OCR,覆盖法语、德语、西班牙语等多种语言。此外,它还支持文本和表格提取,以及批量处理功能。
Monkt是一个文档转换平台,可以将各种文件格式(包括PDF、Word文档和网页)转换为AI可用的Markdown或结构化JSON。它保留语义结构,并支持自定义模式和批量处理,通过Web界面或REST API进行操作。
SVFR是一款视频人脸修复工具,能够让模糊、破损的视频人脸变得清晰、完整,同时支持黑白视频上色,修复视频中的划痕和污点,使老视频焕然一新。
ebook2audiobook是一款开源工具,支持1100+种语言,能够将各类电子书一键转换为带章节的有声书,使用高质量的AI语音合成技术,并可克隆个人声音进行朗读,提供简单直观的网页界面和命令行模式,适合不同用户的需求。
PrimeQA是一个先进的多语言问答研究与开发的主要资源库,支持最新的深度学习模型,易于扩展和定制,并提供多种数据集与基准测试,适用于实时问答和批量处理场景。
dbs-tools是一个命令行工具,旨在将新加坡银行的交易报表转换为易于处理的标准格式,支持多种银行的报表格式,并提供自动化的数据清理和格式化功能。
为大型语言模型(LLMs)使用的HTML DOM到语义化Markdown的转换工具,优化了Web内容的语义信息提取,提高了标记效率并保留了关键的元数据信息。
这是一个超快的文本嵌入模型推断解决方案,支持多种文本嵌入模型,易于集成和使用,具有高效的资源管理能力。
这是一个视频翻译配音工具,可将一种语言的视频翻译为指定语言的视频,自动生成和添加该语言的字幕和配音,并支持API调用。
VoiceCheap是一款基于AI的视频配音和翻译工具,用户可以自定义所有内容,选择使用自己的声音或我们的声音库。它内置了语音转文本、文本转语音、自动字幕和口型同步功能,非常适合YouTuber和课程创作者使用。用户可以免费试用30,000个令牌。
Vidby 是一个快速的视频翻译和配音服务平台,用户只需上传视频或添加链接,选择目标语言并支付费用,即可获得翻译后的视频。
Dubverse是一个由人工智能驱动的在线视频配音平台,允许创作者以闪电般的速度为他们的视频配音,支持多种语言。用户可以上传视频,选择配音语言和人性化的AI声音,利用先进的机器翻译和生成式AI制作可直接发布的视频。平台还提供实时翻译的自助脚本编辑、内置共享功能以便协作,并支持多语言的字幕下载。
HeyGen 是一个全面的视频翻译解决方案,能够自动处理视频中的语音,并支持多语言翻译,适用于多种场景。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型