所有AI工具AI学习网站AI开发框架AI开源项目

RefAug开源项目 – 提升模型推理能力的合成数据增强方法

RefAug是一种用于反思和思维链的合成数据增强方法,旨在通过将问题反思和思考嵌入到以数学为重点的训练数据中,提高模型的推理能力。该方法通过生成替代推理和后续推理,将反思整...

标签:

AI交流(进群备注:RefAug)

RefAug是一种用于反思和思维链的合成数据增强方法,旨在通过将问题反思和思考嵌入到以数学为重点的训练数据中,提高模型的推理能力。该方法通过生成替代推理和后续推理,将反思整合到训练示例中,从而增强模型在数学任务和编码任务中的表现。

RefAug的特点:

  • 1. 提高数学任务的准确率,提升6.8分
  • 2. 在Pass指标中将代码性能提升+3.5个百分点
  • 3. 81.11%的案例在使用反射进行错误修正中表现优于DeepSeek Math
  • 4. 在推理任务上的表现优于传统的思维链(CoT)
  • 5. 训练数据越多,性能越好
  • 6. 发布代码、提示、数据集和脚本

RefAug的功能:

  • 1. 数据准备:收集数学问题或编码任务的数据集
  • 2. 产生反思:对于每个问题,产生使用不同方法或观点解决的替代推理和后续推理
  • 3. 数据增强:将反射整合到训练示例中,每个训练实例包含原始问题、其解决方案和反射部分
  • 4. 微调:使用增强数据集对LLM进行微调,确保模型学习即时解决方案的前向推理和反射推理

相关导航

暂无评论

暂无评论...