FP4 训练是一种创新的深度学习训练方法,能够在保持与FP8和BF16相当精度的同时,扩展到13B大小的模型。与传统方法不同,FP4 训练在2.4B后不会崩溃,适用于大规模模型的训练,并能显著提高训练效率,减少计算资源消耗。