标签:deepseek
GPT-3与AI芯片革命:黄仁勋与DeepSeek的算力博弈
本文探讨了GPT-3与AI芯片革命的关系,聚焦黄仁勋在GPU和CUDA技术上的突破,以及DeepSeek在算力效率革命中的角色。文章分析了英伟达市值缩水的原因,揭示了开...
DeepSeek与MoE架构:AI领域的革命性突破
最近,AI领域的新星DeepSeek凭借其创新性的混合专家架构(MoE)和低训练成本迅速崛起,甚至在应用商店下载榜上超越了ChatGPT。DeepSeek由幻方量化创立,专注...
揭秘ZeRO优化策略:超大规模模型训练的关键技术
《Ultra-Scale Playbook》深入解析了现代LLM训练的关键技术,特别是ZeRO优化策略。本文通过详细探讨ZeRO优化策略的原理、应用及实际案例,揭示了其在超大规模...
DeepSeek:AI领域的新星,如何以低成本挑战OpenAI?
本文深入探讨了DeepSeek模型的核心价值及其在节省算力方面的突破。通过优化算法,DeepSeek用较少的算力训练出与当前最强大模型能力相当的模型,并应用了“蒸馏...
5D并行化技术:超大规模模型训练的革命性突破
本文深入探讨了5D并行化技术在现代超大规模模型训练中的应用,结合《Ultra-Scale Playbook》中的实战案例,详细解析了ZeRO优化策略、CUDA内核优化等关键技术...
TPU与ASIC:AI推理与训练的新趋势
TrendForce集邦咨询报告预测2025年全球AI服务器出货量将年增近28%,DeepSeek驱动下CSP业者将更积极发展成本较低的自有ASIC方案,重心从AI训练转向AI推理。国...
DeepSeek开源之路:技术、生态与商业化的三重挑战
DeepSeek作为大模型开源领域的积极参与者,其能否在竞争激烈的开源生态中保持长期优势,取决于技术、生态和商业化的多重因素。本文从这三个角度深入分析DeepS...
超大规模模型训练实战指南:从技术细节到AI大众化
《Ultra-Scale Playbook》是一份关于超大规模模型训练的实战指南,耗时6个月完成,涵盖了现代LLM训练的关键环节,如5D并行化技术、ZeRO优化策略、CUDA内核优...
Transformer技术驱动AI服务器与ASIC的协同发展
随着Transformer技术的快速发展,AI服务器和ASIC(专用集成电路)正成为推动人工智能落地的关键力量。TrendForce集邦咨询预测,2025年全球AI服务器出货量将年...
ASIC:AI服务器市场的新引擎
随着AI技术的快速发展,ASIC(专用集成电路)在AI服务器市场中的地位日益凸显。TrendForce集邦咨询预测,2025年全球AI服务器出货量将年增近28%,DeepSeek驱动...