标签:Expert Parallelism

DeepEP:MoE模型训练与推理的Expert Parallelism通信基础

DeepSeek宣布开源DeepEP,这是一款专为MoE模型训练和推理设计的Expert Parallelism通信库。DeepEP支持包括FP8在内的低精度计算,并针对NVLink到RDMA的非对称...