标签：Unsloth

革命性GRPO算法：低显存大模型训练的新里程碑

Unsloth发布的GRPO算法革新了大模型训练方式，仅需5GB VRAM即可训练1.5B大模型，显存占用减少90%，资源利用率提升300%。该算法支持超长文本学习，采用FP8 KV...

AI快讯

3个月前

本文深入探讨了AI领域的最新进展，包括Unsloth AI的LLM微调工具、OpenAI的GPT-4.5和GPT-5、DeepMind的AlphaGeometry2系统、Sora图像生成器内测、苹果的机器人...

AI快讯

3个月前