标签:高性能计算
ROCm技术发展与应用挑战:从硬件升级到AI加速的探索
本文探讨了ROCm技术在AI和高性能计算中的应用,特别是从硬件升级到软件框架的挑战。文章分析了ROCm与CUDA的对比,以及其在机器学习领域中的重要性,并讨论了...
从8086到H200:技术演进中的CUDA与AI计算革命
本文从Intel 8086到NVIDIA H200的技术发展脉络出发,探讨了TensorFlow在机器学习领域的核心作用以及CUDA在AI和高性能计算市场中的重要性。文章还分析了DeepSe...
深入探索CUBLAS:CUDA中的高性能矩阵计算利器
本文深入探讨了CUBLAS库在CUDA平台中的重要性,详细介绍了其在矩阵乘法中的高效实现与优化策略。通过对比CUDA Core与Tensor Core的性能,分析了CUBLAS在科学...
NVIDIA CUDA技术革新:推动AI计算与高性能计算的新时代
本文深入探讨NVIDIA CUDA技术的最新发展,特别是40系列显卡在AI计算和高性能计算领域的创新应用。通过分析CUDA架构的演进、高性能计算的新里程碑以及CUDA生态...
三星HBM3内存与AMD MI300X AI加速器:AI计算的新纪元
TechInsights揭示了三星HBM3内存的首个商用实例,该内存集成在AMD的MI300X AI加速器中。三星的HBM3技术带来了更高的带宽、更低的延迟和更高的能效,改变了高...
DeepSeek与RISC-V:开源AI模型如何重塑算力格局
DeepSeek通过MoE架构大幅降低算力需求,为RISC-V架构带来新机遇。玄铁C930处理器的发布,标志着RISC-V迈向高性能计算领域,结合开源AI模型,有望重塑全球算力...
自适应计算图分割技术:AI推理性能的革命性突破
NVIDIA Triton推理服务器通过自适应计算图分割技术,显著提升了AI推理性能,在A100显卡上实现了70B参数模型的推理速度突破。本文将深入探讨该技术的核心原理...
HBM3E芯片:AI时代存储技术的革命性突破
HBM3E芯片作为AI时代的关键存储技术,正在推动半导体市场的变革。本文深入探讨了SK海力士、三星电子和美光科技在HBM3E领域的竞争格局,分析了其技术突破、市...
DeepSeek杭州训练中心:AI算力与液冷技术的完美结合
本文深入探讨了DeepSeek杭州训练中心的核心技术合作,特别是与中科曙光在液冷系统和高性能计算领域的协同创新。文章还分析了这些合作如何提升AI模型训练的效...
DeepSeek杭州训练中心:AI算力与液冷技术的完美结合
DeepSeek杭州训练中心凭借中科曙光的液冷技术,实现了单机柜功率密度达35kW、PUE小于1.15的高效运行。本文深入探讨了DeepSeek在算力基础设施、技术支持等方面...