GRPO-With-Cargo-Feedback是一个GitHub项目,专注于使用GRPO方法微调大型语言模型(LLMs),特别针对Rust编程语言。该项目利用cargo工具链作为反馈机制,通过迭代优化代码编译和测试通过率,显著提升代码质量。项目还提供了一个完整的Marimo Notebook实验工作流,便于复现和执行实验。