标签:低精度计算
DeepSeekR1:高效能AI引擎的技术突破与应用前景
DeepSeekR1作为一款高效能AI引擎,通过低精度计算和混合精度算法实现了性能的显著提升。本文将深入探讨其技术细节,包括8位浮点数、12位浮点数的应用,以及GP...
DeepSeekR1:AI技术的新里程碑,推动Agent产品性能飞跃
DeepSeekR1通过低精度计算和通信优化技术,显著提升了AI模型的效率。其独特的8位浮点数和12位浮点数设计,结合负载均衡策略,为Agent产品的性能飞跃奠定了基...
DeepEP与NVLink:推动MoE模型高效通信的关键技术
DeepSeek宣布开放DeepEP,这是一款专为MoE模型设计的高性能通信库,支持FP8低精度计算,并针对NVLink和RDMA进行了深度优化。本文将探讨DeepEP如何通过高效通...
DeepEP:MoE模型训练与推理的Expert Parallelism通信基础
DeepSeek宣布开源DeepEP,这是一款专为MoE模型训练和推理设计的Expert Parallelism通信库。DeepEP支持包括FP8在内的低精度计算,并针对NVLink到RDMA的非对称...
DeepEP开放:MoE模型训练与推理的革命性突破
DeepSeek宣布开放DeepEP,这是MoE模型训练和推理的核心通信基础,支持FP8低精度计算,并针对非对称带宽转发场景进行深度优化,为现代高性能计算提供高吞吐量...
DeepEP:高性能通信库助力MoE模型高效训练与推理
DeepSeek宣布开放DeepEP,这是一款专为MoE模型设计的高性能通信库。DeepEP通过优化通信协议,支持低精度计算如FP8,并针对NVLink和RDMA场景进行深度优化,显...
测试时间缩放:DeepSeek如何重塑AI推理与训练的未来
本文深入探讨了DeepSeek在测试时间缩放技术上的创新,如何通过低秩KV压缩、FP8矩阵计算和优化通信策略,显著提升AI推理与训练的效率。文章还分析了这些技术对...