高性能计算 | 第 3 页

ROCm技术发展与应用挑战：从硬件升级到AI加速的探索

本文探讨了ROCm技术在AI和高性能计算中的应用，特别是从硬件升级到软件框架的挑战。文章分析了ROCm与CUDA的对比，以及其在机器学习领域中的重要性，并讨论了...

AI快讯

2个月前

本文从Intel 8086到NVIDIA H200的技术发展脉络出发，探讨了TensorFlow在机器学习领域的核心作用以及CUDA在AI和高性能计算市场中的重要性。文章还分析了DeepSe...

AI快讯

2个月前

本文深入探讨了CUBLAS库在CUDA平台中的重要性，详细介绍了其在矩阵乘法中的高效实现与优化策略。通过对比CUDA Core与Tensor Core的性能，分析了CUBLAS在科学...

AI快讯

2个月前

本文深入探讨NVIDIA CUDA技术的最新发展，特别是40系列显卡在AI计算和高性能计算领域的创新应用。通过分析CUDA架构的演进、高性能计算的新里程碑以及CUDA生态...

AI快讯

2个月前

TechInsights揭示了三星HBM3内存的首个商用实例，该内存集成在AMD的MI300X AI加速器中。三星的HBM3技术带来了更高的带宽、更低的延迟和更高的能效，改变了高...

AI快讯

2个月前

DeepSeek通过MoE架构大幅降低算力需求，为RISC-V架构带来新机遇。玄铁C930处理器的发布，标志着RISC-V迈向高性能计算领域，结合开源AI模型，有望重塑全球算力...

AI快讯

2个月前

NVIDIA Triton推理服务器通过自适应计算图分割技术，显著提升了AI推理性能，在A100显卡上实现了70B参数模型的推理速度突破。本文将深入探讨该技术的核心原理...

AI快讯

2个月前

HBM3E芯片作为AI时代的关键存储技术，正在推动半导体市场的变革。本文深入探讨了SK海力士、三星电子和美光科技在HBM3E领域的竞争格局，分析了其技术突破、市...

AI快讯

2个月前

本文深入探讨了DeepSeek杭州训练中心的核心技术合作，特别是与中科曙光在液冷系统和高性能计算领域的协同创新。文章还分析了这些合作如何提升AI模型训练的效...

AI快讯

2个月前

DeepSeek杭州训练中心凭借中科曙光的液冷技术，实现了单机柜功率密度达35kW、PUE小于1.15的高效运行。本文深入探讨了DeepSeek在算力基础设施、技术支持等方面...

AI快讯

2个月前