标签:高性能计算

英伟达Blackwell架构:引领AI与高性能计算的未来

英伟达即将在GTC 2025大会上发布基于Blackwell架构的B300和GB300系列芯片,性能提升高达50%。大会还将探讨量子计算、CPO交换机技术及NVL288机架系统,重新定...

GeForce RTX 50系列显卡:AI技术驱动下的游戏与计算革命

NVIDIA在CES 2025上发布了新一代GeForce RTX 50系列显卡,采用Blackwell架构和DLSS 3.0技术,显著提升了游戏性能与计算能力。本文将深入探讨RTX 50系列的亮点...

探索TSP架构:AI芯片的未来革命

本文深入探讨了Groq公司推出的基于Tensor Streaming Architecture (TSA) 架构的Tensor Streaming Processor (TSP),这款AI芯片专为云端大模型推理设计,通过...

创新 TSA 架构:AI 芯片革命与未来计算的新篇章

美国 AI 初创公司 Groq 推出的 TSA 架构 AI 芯片,通过创新的 Tensor Streaming Architecture 和超高带宽 SRAM,实现了惊人的推理速度和能效,被誉为全球首个...

Fire-Flyer 2:中国AI公司在推理模型研发中的突破与开源创新

本文探讨了中国AI公司在推理模型研发中的快速进展,重点关注DeepSeek等公司通过开源创新和高性能计算优化实现的技术突破。文章详细介绍了Fire-Flyer 2文件系...

CUDA的未来:从32位到64位的技术演进

随着英伟达逐步淘汰32位CUDA支持,新一代Blackwell架构GPU全面转向64位计算。本文将探讨这一技术变革对开发者和高性能计算领域的影响,以及如何应对兼容性挑战。

GroqChip™处理器:AI语言模型推理速度的革命性突破

Groq公司推出的LPU™推理引擎和GroqChip™处理器,通过克服计算密度和内存带宽的瓶颈,为AI语言应用程序提供了前所未有的推理速度。本文将深入探讨GroqChip™的...

Groq的简约之道:如何通过智能编译器与流线型架构重塑AI芯片

本文深入探讨了Groq公司如何通过简约而高效的架构设计,结合智能编译器技术,在AI芯片领域实现突破。文章分析了Groq的独特优势,并探讨了其未来在人工智能和...

Databricks Unified Data Analytics Platform:数据驱动未来的核心引擎

本文深入探讨Databricks Unified Data Analytics Platform的核心功能与应用场景,解析其如何通过统一工作空间、高性能计算、机器学习与人工智能等特性,帮助...

谷歌TPUv4在AI大模型中的应用与竞争优势

苹果在其AI大模型的开发中选择了谷歌的TPUv4和TPUv5p,而非英伟达的GPU。这一选择突显了TPU在AI训练与推理中的高效性能。本文将探讨TPUv4的技术优势、在复杂...
1 2 3 4