标签:Muon优化器

月之暗面技术创新:Muon优化器助力大规模预训练模型突破

月之暗面团队通过改进Muon优化器,成功将其应用于大规模预训练模型,显著降低算力需求并提升模型性能。这一技术突破不仅验证了Muon在大规模训练中的可行性,...