该项目提出了一种基于梯度的元梯度下降(MGD)方法,用于优化机器学习训练的元参数,如数据选择和学习率调度等。MGD通过直接优化训练过程来调整元参数,挑战传统的网格搜索方法。项目还引入了REPLAY算法,用于在大规模迭代机器学习算法中高效计算精确的元梯度。研究在多个具有挑战性的任务中验证了MGD和REPLAY的有效性,例如DataComp-small竞赛和指令微调等。