标签:高性能计算
NVIDIA HGX H200:引领AI与高性能计算的新纪元
近日,NVIDIA推出HGX H200平台,结合Hopper Tensor Core GPU与Grace CPU,为AI与高性能计算领域带来革命性突破。该平台提供高达900GB/s的带宽,性能提升10倍...
Gemini 2.0:多语言支持与高性能AI模型的革新
Gemini 2.0及其衍生模型在多语言支持和高性能计算方面展现了卓越的能力,支持超过50种语言,并在LMArena基准测试中超越多个知名模型。本文将深入探讨Gemini 2...
DeepEP开源:推动MoE模型训练与推理的高性能通信革命
DeepSeek宣布开源DeepEP,这是一款专为MoE模型训练和推理优化的高性能通信库。DeepEP支持FP8低精度计算,并针对NVLink和RDMA场景进行深度优化,显著提升通信...
DeepEP与NVLink:推动MoE模型高效通信的关键技术
DeepSeek宣布开放DeepEP,这是一款专为MoE模型设计的高性能通信库,支持FP8低精度计算,并针对NVLink和RDMA进行了深度优化。本文将探讨DeepEP如何通过高效通...
DeepEP:MoE模型训练与推理的Expert Parallelism通信基础
DeepSeek宣布开源DeepEP,这是一款专为MoE模型训练和推理设计的Expert Parallelism通信库。DeepEP支持包括FP8在内的低精度计算,并针对NVLink到RDMA的非对称...
DeepSeek公开FlashMLA技术:全球AI训练与推理的新篇章
DeepSeek公司宣布向全球公开其核心技术FlashMLA,这一技术能够在中低端AI芯片上实现复杂的高性能训练和推理任务,显著提升性能而不需高昂成本。此举打破了美...
DeepEP开放:MoE模型训练与推理的革命性突破
DeepSeek宣布开放DeepEP,这是MoE模型训练和推理的核心通信基础,支持FP8低精度计算,并针对非对称带宽转发场景进行深度优化,为现代高性能计算提供高吞吐量...
DeepEP:高性能通信库助力MoE模型高效训练与推理
DeepSeek宣布开放DeepEP,这是一款专为MoE模型设计的高性能通信库。DeepEP通过优化通信协议,支持低精度计算如FP8,并针对NVLink和RDMA场景进行深度优化,显...
英伟达H100:AI算力的巅峰之作与未来趋势
本文深入探讨了英伟达H100在AI算力领域的卓越表现及其在AI发展中的关键作用。文章分析了H100在处理大数据、执行复杂算法和推动技术创新方面的优势,并展望了...
英伟达RTX 50系列:从Ada到Blackwell,GPU技术的革命性飞跃
英伟达CEO黄仁勋在主题演讲中宣布了多项技术进展,包括推出采用Blackwell技术的新型消费类游戏芯片GeForce RTX 50系列GPU,该GPU拥有920亿个晶体管和四个AI处...