Qwen2.5-Math-7B-Instruct是2024年9月发布的数学推理专用指令微调模型,基于76.2亿参数的Qwen2.5-7B开发,支持BF16数据类型。该模型通过链式思维(CoT)和工具集成推理(TIR)方法解决中英文数学问题,在MATH基准测试中TIR模式得分达85.3,较前代Qwen2-Math性能显著提升。虽然被Eurus-2-7B-PRIME超越精度,但仍作为评估PRIME方法的基准模型。