所有AI工具AI办公工具AI开发框架AI开源项目

docling-api开源项目 – 高效文档转换后端

docling-api是一个高效、可扩展的文档转换后端服务器,能够轻松将多种文档格式(如PDF、DOCX、PPTX、HTML、图片等)转换为Markdown格式。它支持CPU和GPU处理,尤其在GPU模式下性能...

标签:

AI交流(进群备注:docling-api)

docling-api是一个高效、可扩展的文档转换后端服务器,能够轻松将多种文档格式(如PDF、DOCX、PPTX、HTML、图片等)转换为Markdown格式。它支持CPU和GPU处理,尤其在GPU模式下性能显著提升。该API提供同步和异步接口,满足不同场景需求,并支持多语言OCR,覆盖法语、德语、西班牙语等多种语言。此外,它还支持文本和表格提取,以及批量处理功能。

docling-api的特点:

  • 1. 支持CPU和GPU处理,GPU模式下性能显著提升
  • 2. 提供同步和异步API接口,满足不同场景需求
  • 3. 多语言OCR支持,覆盖法语、德语、西班牙语等多种语言
  • 4. 支持文本和表格提取
  • 5. 支持批量处理

docling-api的功能:

  • 1. 将PDF文档转换为Markdown格式
  • 2. 将DOCX文档转换为Markdown格式
  • 3. 将PPTX文档转换为Markdown格式
  • 4. 将HTML文档转换为Markdown格式
  • 5. 将图片中的文本通过OCR转换为Markdown格式

相关导航

暂无评论

暂无评论...