该论文提出了一种在潜在空间(latent space)中进行推理训练的方法,不需要特殊训练数据,且能处理难以用语言描述的推理任务。3.5B 的参数达到了 50B 参数模型的推理基准性能。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型