高性能计算 | AI-magic

NVIDIA HGX H200：引领AI与高性能计算的新纪元

近日，NVIDIA推出HGX H200平台，结合Hopper Tensor Core GPU与Grace CPU，为AI与高性能计算领域带来革命性突破。该平台提供高达900GB/s的带宽，性能提升10倍...

AI快讯

2个月前

Gemini 2.0及其衍生模型在多语言支持和高性能计算方面展现了卓越的能力，支持超过50种语言，并在LMArena基准测试中超越多个知名模型。本文将深入探讨Gemini 2...

AI快讯

2个月前

DeepSeek宣布开源DeepEP，这是一款专为MoE模型训练和推理优化的高性能通信库。DeepEP支持FP8低精度计算，并针对NVLink和RDMA场景进行深度优化，显著提升通信...

AI快讯

2个月前

DeepSeek宣布开放DeepEP，这是一款专为MoE模型设计的高性能通信库，支持FP8低精度计算，并针对NVLink和RDMA进行了深度优化。本文将探讨DeepEP如何通过高效通...

AI快讯

2个月前

DeepSeek宣布开源DeepEP，这是一款专为MoE模型训练和推理设计的Expert Parallelism通信库。DeepEP支持包括FP8在内的低精度计算，并针对NVLink到RDMA的非对称...

AI快讯

2个月前

DeepSeek公司宣布向全球公开其核心技术FlashMLA，这一技术能够在中低端AI芯片上实现复杂的高性能训练和推理任务，显著提升性能而不需高昂成本。此举打破了美...

AI快讯

2个月前

DeepSeek宣布开放DeepEP，这是MoE模型训练和推理的核心通信基础，支持FP8低精度计算，并针对非对称带宽转发场景进行深度优化，为现代高性能计算提供高吞吐量...

AI快讯

2个月前

DeepSeek宣布开放DeepEP，这是一款专为MoE模型设计的高性能通信库。DeepEP通过优化通信协议，支持低精度计算如FP8，并针对NVLink和RDMA场景进行深度优化，显...

AI快讯

2个月前

本文深入探讨了英伟达H100在AI算力领域的卓越表现及其在AI发展中的关键作用。文章分析了H100在处理大数据、执行复杂算法和推动技术创新方面的优势，并展望了...

AI快讯

2个月前

英伟达CEO黄仁勋在主题演讲中宣布了多项技术进展，包括推出采用Blackwell技术的新型消费类游戏芯片GeForce RTX 50系列GPU，该GPU拥有920亿个晶体管和四个AI处...

AI快讯

2个月前