Sky-T1-32B-Preview模型 – 低成本高性能开源推理模型
Sky-T1-32B-Preview是由UC Berkeley Sky Computing Lab的NovaSky团队开发的开源32亿参数语言模型,基于Qwen2.5-32B-Instruct训练,使用17,000个验证正确的响应数据进行监督微调。该模型以仅450美元的低成本(19小时/8个H100 GPU)实现与商业模型o1-Preview相当的推理性能,特别擅长数学推理和代码生成任务,同时保持指令跟随等基础能力。项目完全开源模型权重、训练代码和数据,旨在推动学术研究和开源社区发展。