标签：MoE模型

DeepEP开源：推动MoE模型训练与推理的高性能通信革命

DeepSeek宣布开源DeepEP，这是一款专为MoE模型训练和推理优化的高性能通信库。DeepEP支持FP8低精度计算，并针对NVLink和RDMA场景进行深度优化，显著提升通信...

AI快讯

2个月前

DeepEP与NVLink：推动MoE模型高效通信的关键技术

DeepSeek宣布开放DeepEP，这是一款专为MoE模型设计的高性能通信库，支持FP8低精度计算，并针对NVLink和RDMA进行了深度优化。本文将探讨DeepEP如何通过高效通...

AI快讯

2个月前

DeepEP：MoE模型训练与推理的Expert Parallelism通信基础

DeepSeek宣布开源DeepEP，这是一款专为MoE模型训练和推理设计的Expert Parallelism通信库。DeepEP支持包括FP8在内的低精度计算，并针对NVLink到RDMA的非对称...

AI快讯

2个月前

DeepEP开放：MoE模型训练与推理的革命性突破

DeepSeek宣布开放DeepEP，这是MoE模型训练和推理的核心通信基础，支持FP8低精度计算，并针对非对称带宽转发场景进行深度优化，为现代高性能计算提供高吞吐量...

AI快讯

2个月前

DeepEP：高性能通信库助力MoE模型高效训练与推理

DeepSeek宣布开放DeepEP，这是一款专为MoE模型设计的高性能通信库。DeepEP通过优化通信协议，支持低精度计算如FP8，并针对NVLink和RDMA场景进行深度优化，显...

AI快讯

2个月前

DeepSeek-V3：MoE模型的革命性突破与行业影响

DeepSeek-V3作为幻方量化推出的自研MoE模型，凭借6710亿参数和3倍生成速度的提升，在多项基准测试中表现卓越，尤其在数学能力上超越了所有开源和闭源模型。其...

AI快讯

2个月前

DeepSeek-V3：AI大模型的新标杆，低成本高性能的奇迹

幻方量化发布的DeepSeek-V3模型凭借其6710亿参数和卓越的数学能力，成为AI大模型领域的新标杆。该模型生成速度提升3倍，训练成本仅557.6万美元，API服务定价...

AI快讯

2个月前

测试时间缩放：DeepSeek如何重塑AI推理与训练的未来

本文深入探讨了DeepSeek在测试时间缩放技术上的创新，如何通过低秩KV压缩、FP8矩阵计算和优化通信策略，显著提升AI推理与训练的效率。文章还分析了这些技术对...

AI快讯

2个月前

DeepSeek与MoE模型：中国AI崛起的创新引擎

文章探讨了DeepSeek公司在AI领域的创新突破，特别是其基于MoE架构的模型如何通过动态知识唤醒、长文本处理等核心技术，以低成本、高效能的优势挑战国际巨头。...

AI快讯

2个月前

DeepEP：开源AI通信库的革命性突破

DeepSeek在“开源周”期间发布了DeepEP，这是一款专为MoE模型训练和推理设计的开源通信库。通过优化全通信、支持NVLink和RDMA、引入FP8等技术，DeepEP显著提升...

AI快讯

3个月前

1 2

AI-magic收录了大量国内外AI工具箱，包括AI写作、图像、视频、音频、编程等各类AI工具，以及常用的AI学习、技术、和模型等信息，让你轻松加入人工智能浪潮。

Copyright © 2025 AI-magic 浙ICP备19008543号-3