DocAligner 是一种用于校正拍照文档图像的工具,能够处理文档的扭曲、光照不均和布局定位问题。它通过建立拍照文档与清晰图像间的密集对应关系,实现标注自动化,提升文档图像分析与识别在真实场景中的应用效率。其核心技术包括扭曲图像预对齐、分层对齐、细节循环细化以及自监督学习。DocAligner 可应用于文档布局分析、光照校正和几何校正等场景,显著提升文档图像处理的质量和效率。