SFT

Qwen2.5-Max是一个基于大量数据进行预训练的大型MOELLM，通过策划的SFT和RLHF配方进行后训练，实现了与顶级型号竞争的性能。该模型在多个基准测试中表现出色，包括Arena Hard、LiveBench、LiveCodeBench和GPQA-Diamond等，甚至击败了DeepSeek V3，并在理论性能上超越了DeepSeek-V3。

API接口Qwen2.5-MaxRLHFSFT

AI-magic收录了大量国内外AI工具箱，包括AI写作、图像、视频、音频、编程等各类AI工具，以及常用的AI学习、技术、和模型等信息，让你轻松加入人工智能浪潮。