Light-R1是一个以不到1000美元的成本,从零开始训练出超越现有数学大模型的AI项目。它仅需6小时训练时间,并在AIME24等数学竞赛中超越了DeepSeek-R1-Distill-Qwen-32B。项目提供完整的训练数据和代码,帮助用户低成本复现AI模型。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型