标签:RDMA
DeepEP开源:推动MoE模型训练与推理的高性能通信革命
DeepSeek宣布开源DeepEP,这是一款专为MoE模型训练和推理优化的高性能通信库。DeepEP支持FP8低精度计算,并针对NVLink和RDMA场景进行深度优化,显著提升通信...
DeepEP:MoE模型训练与推理的Expert Parallelism通信基础
DeepSeek宣布开源DeepEP,这是一款专为MoE模型训练和推理设计的Expert Parallelism通信库。DeepEP支持包括FP8在内的低精度计算,并针对NVLink到RDMA的非对称...
DeepEP通信库:AI快递高速路系统的革命性突破
DeepSeek于2025年2月25日开源的DeepEP通信库,专为混合专家模型(MoE)设计,通过优化NVLink和RDMA技术,实现了极速传输、智能分拣与压缩,以及颠覆性的成本...
DeepEP通信库:AI快递高速路系统的革命性突破
DeepSeek于2025年2月25日开源的DeepEP通信库,专为混合专家模型(MoE)设计,通过优化NVLink和RDMA技术,实现了极速传输、智能分拣与压缩,显著降低了成本。...