DeepSeek-671B-SFT-Guide 是一个开源的全参数微调指南,提供了 DeepSeek V3/R1 671B 模型的训练和推理代码,并包含了实践中的经验和结论。该项目旨在帮助开发者更好地理解和应用超大规模模型的微调技术,提供从训练到推理的完整解决方案。