Advanced Literate Machinery (ALM) 是阿里巴巴研究团队开发的一个高级文档智能系统,旨在赋予机器阅读、思考和创造的能力。项目当前专注于从图像和文档中提取信息,未来将探索让机器具备更高层次的智能。项目包含多个子模块,如OmniParser、Platypus、SceneVTG等,涵盖了文本识别、关键信息提取、表格识别、文档解析等多种功能。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型