MMR1是多模态推理领域的前沿项目,通过极少量数据实现顶尖性能。该项目仅使用6k公开数据进行训练,达到了开源7B多模态模型的SOTA性能,并且在6小时内完成高效训练,具有极高的性价比。此外,MMR1采用了数据平衡策略,能够覆盖多样化的数学问题类型。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型