标签:通信优化

DeepSeekR1:AI技术的新里程碑,推动Agent产品性能飞跃

DeepSeekR1通过低精度计算和通信优化技术,显著提升了AI模型的效率。其独特的8位浮点数和12位浮点数设计,结合负载均衡策略,为Agent产品的性能飞跃奠定了基...

DeepEP与NVLink:推动MoE模型高效通信的关键技术

DeepSeek宣布开放DeepEP,这是一款专为MoE模型设计的高性能通信库,支持FP8低精度计算,并针对NVLink和RDMA进行了深度优化。本文将探讨DeepEP如何通过高效通...

DeepEP:MoE模型训练与推理的Expert Parallelism通信基础

DeepSeek宣布开源DeepEP,这是一款专为MoE模型训练和推理设计的Expert Parallelism通信库。DeepEP支持包括FP8在内的低精度计算,并针对NVLink到RDMA的非对称...

DeepEP:高性能通信库助力MoE模型高效训练与推理

DeepSeek宣布开放DeepEP,这是一款专为MoE模型设计的高性能通信库。DeepEP通过优化通信协议,支持低精度计算如FP8,并针对NVLink和RDMA场景进行深度优化,显...