NDocLayout-YOLO-DocStructBench官网 – 实时文档布局检测模型
DocLayout-YOLO-DocStructBench 是一个基于 YOLO-v10 的文档布局检测模型,由上海 AI 实验室开发。该模型通过多样化文档预训练和结构优化,实现了对各种文档类型的实时鲁棒检测。预训练阶段采用 Mesh-candidate BestFit 算法生成 DocSynth-300K 数据集,显著提升了模型在不同文档类型上的微调性能。该模型适用于文档理解任务,如提取文本、图像和表格等。