LLaMA-Factory开源项目 – 高效微调大语言模型的工具
LLaMA-Factory 是一个易于使用的 WebUI 框架,旨在高效微调 100 多种大语言模型(LLM)。它支持多种模型和训练方法,包括 LLaMA、Mistral、Qwen 等,并集成了多种微调方法如 LoRA、QLoRA、PPO、DPO 等。LLaMA-Factory 提供了高级算法如 GaLore、BAdam、DoRA、LongLoRA 等,以及实用技巧如 flashattention、RoPE 缩放等,以优化微调效果。此外,它还支持实验管理工具如 LlamaBoard、TensorBoard、Wandb,以及高效的推理接口如 Gradio UI 和 OpenAI 风格的 API。