Knowledge-R1是一个旨在增强知识检索与推理能力协同的框架,解决推理模型中知识不足和复杂推理优化的挑战。它通过多轮知识交互逐步提升模型的理解和决策能力,并利用强化学习动态优化知识与推理的协同。该框架已在Qwen-1.5B-Instruct模型上成功复现了显著的改进效果。