TRACT是一种创新的两阶段微调方法,结合了链式思考(CoT)推理和回归感知微调(RAFT),旨在提升大型语言模型(LLM)在数值评分预测中的表现,特别是在‘LLM-as-a-Judge’场景下。通过第一阶段生成高质量的CoT数据,并在第二阶段利用这些数据进一步微调模型,TRACT显著提升了模型性能,超越了现有方法和基准模型。