标签:DeepEP
DeepEP开源:推动MoE模型训练与推理的高性能通信革命
DeepSeek宣布开源DeepEP,这是一款专为MoE模型训练和推理优化的高性能通信库。DeepEP支持FP8低精度计算,并针对NVLink和RDMA场景进行深度优化,显著提升通信...
DeepEP与NVLink:推动MoE模型高效通信的关键技术
DeepSeek宣布开放DeepEP,这是一款专为MoE模型设计的高性能通信库,支持FP8低精度计算,并针对NVLink和RDMA进行了深度优化。本文将探讨DeepEP如何通过高效通...
FP8低精度计算:DeepSeek如何推动AI模型的高效革命
DeepSeek通过开源DeepEP等核心技术,推动了FP8低精度计算在AI模型中的应用,显著提升了训练和推理效率。本文将深入探讨FP8低精度计算的优势、DeepSeek的创新...
DeepEP:MoE模型训练与推理的Expert Parallelism通信基础
DeepSeek宣布开源DeepEP,这是一款专为MoE模型训练和推理设计的Expert Parallelism通信库。DeepEP支持包括FP8在内的低精度计算,并针对NVLink到RDMA的非对称...
DeepEP开放:MoE模型训练与推理的革命性突破
DeepSeek宣布开放DeepEP,这是MoE模型训练和推理的核心通信基础,支持FP8低精度计算,并针对非对称带宽转发场景进行深度优化,为现代高性能计算提供高吞吐量...
DeepEP:高性能通信库助力MoE模型高效训练与推理
DeepSeek宣布开放DeepEP,这是一款专为MoE模型设计的高性能通信库。DeepEP通过优化通信协议,支持低精度计算如FP8,并针对NVLink和RDMA场景进行深度优化,显...
DeepEP:深度学习技术在多领域的创新与应用
本文探讨了DeepEP在蛋白质识别和分布式系统中的创新应用,结合全国人大代表和政协委员的建议,分析了AI技术在智能电动车辆、无人驾驶等领域的广泛发展前景,...
多头潜在注意力机制:深度求索的低成本AI革命
中国人工智能初创企业深度求索通过开源多头潜在注意力机制(MLA)等创新技术,实现了低成本、高性能的AI模型训练和推理。其开源项目FlashMLA和DeepEP在芯片性...
深度求索开源混合专家模型技术,引领AI高效训练新浪潮
中国人工智能初创企业深度求索开源了混合专家模型训练与推理的通信库DeepEP,并披露了其低成本、高性能模型的技术细节,驳斥了虚报成本的指控。这一开源项目...
DeepSeek-V3:低成本高性能AI大模型的创新之路
深度求索公司推出的DeepSeek-V3大模型凭借其低成本、高性能的特点,赢得了开源社区的广泛赞誉。通过开源FlashMLA和DeepEP等项目,该公司展示了其在芯片性能优...
1
2