AI交流(进群备注:RefAug)

RefAug是一种用于反思和思维链的合成数据增强方法,旨在通过将问题反思和思考嵌入到以数学为重点的训练数据中,提高模型的推理能力。该方法通过生成替代推理和后续推理,将反思整合到训练示例中,从而增强模型在数学任务和编码任务中的表现。
RefAug的特点:
- 1. 提高数学任务的准确率,提升6.8分
- 2. 在Pass指标中将代码性能提升+3.5个百分点
- 3. 81.11%的案例在使用反射进行错误修正中表现优于DeepSeek Math
- 4. 在推理任务上的表现优于传统的思维链(CoT)
- 5. 训练数据越多,性能越好
- 6. 发布代码、提示、数据集和脚本
RefAug的功能:
- 1. 数据准备:收集数学问题或编码任务的数据集
- 2. 产生反思:对于每个问题,产生使用不同方法或观点解决的替代推理和后续推理
- 3. 数据增强:将反射整合到训练示例中,每个训练实例包含原始问题、其解决方案和反射部分
- 4. 微调:使用增强数据集对LLM进行微调,确保模型学习即时解决方案的前向推理和反射推理
相关导航
暂无评论...