所有AI工具AI办公工具AI图像工具AI开源项目

Advanced Literate Machinery开源项目 – 高级文档智能系统

Advanced Literate Machinery (ALM) 是阿里巴巴研究团队开发的一个高级文档智能系统,旨在赋予机器阅读、思考和创造的能力。项目当前专注于从图像和文档中提取信息,未来将探索让...

标签:

AI交流(进群备注:Advanced Literate Machinery)

Advanced Literate Machinery (ALM) 是阿里巴巴研究团队开发的一个高级文档智能系统,旨在赋予机器阅读、思考和创造的能力。项目当前专注于从图像和文档中提取信息,未来将探索让机器具备更高层次的智能。项目包含多个子模块,如OmniParser、Platypus、SceneVTG等,涵盖了文本识别、关键信息提取、表格识别、文档解析等多种功能。

Advanced Literate Machinery的特点:

  • 1. 统一的编码器-解码器架构
  • 2. 支持多种文档解析任务
  • 3. 高效的文本识别与信息提取
  • 4. 跨模态的视觉-语言预训练
  • 5. 轻量级模型,适合移动设备部署

Advanced Literate Machinery的功能:

  • 1. 复杂场景下的文本识别
  • 2. 关键信息提取与表格识别
  • 3. 文档布局分析与结构解析
  • 4. 网页视觉参数自动生成
  • 5. 多语言文本阅读与解析

相关导航

暂无评论

暂无评论...