Qwen2.5-Max是一个基于大量数据进行预训练的大型MOELLM,通过策划的SFT和RLHF配方进行后训练,实现了与顶级型号竞争的性能。该模型在多个基准测试中表现出色,包括Arena Hard、LiveBench、LiveCodeBench和GPQA-Diamond等,甚至击败了DeepSeek V3,并在理论性能上超越了DeepSeek-V3。