dolphin-r1是一个开源的推理数据集,从DeepSeek-R1、Gemini 2.0 flash thinking和Dolphin大模型中蒸馏了总计80万条数据,专门用于训练推理大模型。该数据集包含了从不同来源蒸馏的推理和聊天样本,适用于多种自然语言处理任务。