标签:GPU计算

CUDA技术:从图形处理到AI计算的革命性跨越

本文深入探讨了CUDA技术的发展历程及其在AI和科学计算领域的应用,揭示了英伟达如何通过CUDA技术实现从图形处理到高性能计算的跨越。文章还分析了黄仁勋的前...

NVIDIA GB10 Grace Blackwell超级芯片:开启个人AI超级计算新时代

NVIDIA在2025年CES上发布了基于GB10 Grace Blackwell超级芯片的个人AI超级计算机Project DIGITS。这款设备提供高达1千万亿次的计算能力,支持2000亿参数的AI...

深入探索CUBLAS:CUDA中的高性能矩阵计算利器

本文深入探讨了CUBLAS库在CUDA平台中的重要性,详细介绍了其在矩阵乘法中的高效实现与优化策略。通过对比CUDA Core与Tensor Core的性能,分析了CUBLAS在科学...

自适应计算图分割技术:AI推理性能的革命性突破

NVIDIA Triton推理服务器通过自适应计算图分割技术,显著提升了AI推理性能,在A100显卡上实现了70B参数模型的推理速度突破。本文将深入探讨该技术的核心原理...