标签:大规模模型训练

DeepSeek开源周:优化并行策略推动AI训练效率革命

DeepSeek在开源周期间发布了一系列优化并行策略工具,包括DualPipe和EPLB,旨在解决大规模AI模型训练中的效率问题。这些工具通过重叠计算与通信、动态负载均...

DeepEP:开源AI通信库的革命性突破

DeepSeek在“开源周”期间发布了DeepEP,这是一款专为MoE模型训练和推理设计的开源通信库。通过优化全通信、支持NVLink和RDMA、引入FP8等技术,DeepEP显著提升...