r1-overthinker 是一个为 DeepSeek R1 模型设计的深度思考工具,通过强制模型更长时间地思考,提升其推理深度。它支持从 1.5B 到 70B 参数的多种模型,具有无限上下文长度,但受限于 GPU 内存。该工具通过延长推理过程,检测早期结论并通过提示鼓励更多思考,直到达到设定的阈值,从而提高模型的回答质量和准确性。