该项目由Microsoft Research开发,研究语言模型如何通过自生成编程难题并验证解决方案的自动化过程来提升编程能力。核心机制包括生成编程谜题、多轮尝试解决、Python解释器验证正确性,并基于正确结果微调模型。实验表明,该方法可使中小型语言模型在编程任务上的测试准确率翻倍,尤其适用于竞争性编程问题和算法设计场景。