dhSegment是一个通用的深度学习框架,专门用于文档分割,尤其适用于历史文档处理。它能够从不同类型的文档中提取内容(如文本区域、图像等),并支持复杂的文档布局分析。该项目是开源的,可在GitHub上获取,广泛应用于数字保存、文档内容提取和OCR预处理等领域。