标签:MoE模型

DeepEP开源:推动MoE模型训练与推理的高性能通信革命

DeepSeek宣布开源DeepEP,这是一款专为MoE模型训练和推理优化的高性能通信库。DeepEP支持FP8低精度计算,并针对NVLink和RDMA场景进行深度优化,显著提升通信...

DeepEP与NVLink:推动MoE模型高效通信的关键技术

DeepSeek宣布开放DeepEP,这是一款专为MoE模型设计的高性能通信库,支持FP8低精度计算,并针对NVLink和RDMA进行了深度优化。本文将探讨DeepEP如何通过高效通...

DeepEP:MoE模型训练与推理的Expert Parallelism通信基础

DeepSeek宣布开源DeepEP,这是一款专为MoE模型训练和推理设计的Expert Parallelism通信库。DeepEP支持包括FP8在内的低精度计算,并针对NVLink到RDMA的非对称...

DeepEP开放:MoE模型训练与推理的革命性突破

DeepSeek宣布开放DeepEP,这是MoE模型训练和推理的核心通信基础,支持FP8低精度计算,并针对非对称带宽转发场景进行深度优化,为现代高性能计算提供高吞吐量...

DeepEP:高性能通信库助力MoE模型高效训练与推理

DeepSeek宣布开放DeepEP,这是一款专为MoE模型设计的高性能通信库。DeepEP通过优化通信协议,支持低精度计算如FP8,并针对NVLink和RDMA场景进行深度优化,显...

DeepSeek-V3:MoE模型的革命性突破与行业影响

DeepSeek-V3作为幻方量化推出的自研MoE模型,凭借6710亿参数和3倍生成速度的提升,在多项基准测试中表现卓越,尤其在数学能力上超越了所有开源和闭源模型。其...

DeepSeek-V3:AI大模型的新标杆,低成本高性能的奇迹

幻方量化发布的DeepSeek-V3模型凭借其6710亿参数和卓越的数学能力,成为AI大模型领域的新标杆。该模型生成速度提升3倍,训练成本仅557.6万美元,API服务定价...

测试时间缩放:DeepSeek如何重塑AI推理与训练的未来

本文深入探讨了DeepSeek在测试时间缩放技术上的创新,如何通过低秩KV压缩、FP8矩阵计算和优化通信策略,显著提升AI推理与训练的效率。文章还分析了这些技术对...

DeepSeek与MoE模型:中国AI崛起的创新引擎

文章探讨了DeepSeek公司在AI领域的创新突破,特别是其基于MoE架构的模型如何通过动态知识唤醒、长文本处理等核心技术,以低成本、高效能的优势挑战国际巨头。...

DeepEP:开源AI通信库的革命性突破

DeepSeek在“开源周”期间发布了DeepEP,这是一款专为MoE模型训练和推理设计的开源通信库。通过优化全通信、支持NVLink和RDMA、引入FP8等技术,DeepEP显著提升...
1 2