SmolDocling-256M-preview 是由 IBM 研究院与 Hugging Face 合作开发的超紧凑视觉语言模型,专为高效文档转换设计。其参数量仅为2.56亿,性能却可媲美参数量高出27倍的模型,显著降低了计算资源需求。该模型引入了‘DocTags’通用标记格式,能够同时捕获文档的文本内容、结构和元素的空间布局,支持多种文档元素的识别和处理,包括文本、表格、图表、代码和公式。