PENCIL 是一种创新方法,通过将归约机制集成到 Chain-of-Thought (CoT) 框架中,增强大型语言模型 (LLM) 的推理能力。它允许模型递归地清理中间推理步骤,显著提高内存效率,使模型能够在有限内存下生成更长的推理链,从而解决更大规模的问题。例如,PENCIL 在爱因斯坦谜题上达到了 97% 的准确率,即使使用小模型也能高效推理。