所有AI工具AI学习网站AI开发框架AI开源项目

s1开源项目 – 低成本高效AI模型

s1是一个通过精心挑选的微调样本进行训练的AI模型,使用不到50美元的训练成本。训练过程中,选择了1000个问题,并通过Gemini Thinking Experimental提取这些问题的推理轨迹和答案...

标签:

AI交流(进群备注:s1)

s1是一个通过精心挑选的微调样本进行训练的AI模型,使用不到50美元的训练成本。训练过程中,选择了1000个问题,并通过Gemini Thinking Experimental提取这些问题的推理轨迹和答案。实验表明,使用1K样本进行监督微调(SFT)在小型数据集上仅需在16个H100 GPU上进行26分钟的训练。训练后,使用预算强制策略来控制模型测试时的计算量,通过强制终止或延长模型的思考过程来优化生成结果。

s1的特点:

  • 1. 低成本训练,仅需不到50美元
  • 2. 使用1000个样本进行监督微调
  • 3. 训练时间短,仅需26分钟
  • 4. 预算强制策略优化生成结果
  • 5. 支持多种推理方式(vLLM、transformers等)

s1的功能:

  • 1. 使用vLLM进行推理
  • 2. 使用vLLM进行预算强制推理
  • 3. 使用transformers库进行推理
  • 4. 训练自定义模型
  • 5. 评估模型性能

相关导航

暂无评论

暂无评论...