deepseek | 第 6 页

GPT-3与AI芯片革命：黄仁勋与DeepSeek的算力博弈

本文探讨了GPT-3与AI芯片革命的关系，聚焦黄仁勋在GPU和CUDA技术上的突破，以及DeepSeek在算力效率革命中的角色。文章分析了英伟达市值缩水的原因，揭示了开...

AI快讯

4个月前

最近，AI领域的新星DeepSeek凭借其创新性的混合专家架构（MoE）和低训练成本迅速崛起，甚至在应用商店下载榜上超越了ChatGPT。DeepSeek由幻方量化创立，专注...

AI快讯

4个月前

《Ultra-Scale Playbook》深入解析了现代LLM训练的关键技术，特别是ZeRO优化策略。本文通过详细探讨ZeRO优化策略的原理、应用及实际案例，揭示了其在超大规模...

AI快讯

4个月前

本文深入探讨了DeepSeek模型的核心价值及其在节省算力方面的突破。通过优化算法，DeepSeek用较少的算力训练出与当前最强大模型能力相当的模型，并应用了“蒸馏...

AI快讯

4个月前

本文深入探讨了5D并行化技术在现代超大规模模型训练中的应用，结合《Ultra-Scale Playbook》中的实战案例，详细解析了ZeRO优化策略、CUDA内核优化等关键技术...

AI快讯

4个月前

TrendForce集邦咨询报告预测2025年全球AI服务器出货量将年增近28%，DeepSeek驱动下CSP业者将更积极发展成本较低的自有ASIC方案，重心从AI训练转向AI推理。国...

AI快讯

4个月前

DeepSeek作为大模型开源领域的积极参与者，其能否在竞争激烈的开源生态中保持长期优势，取决于技术、生态和商业化的多重因素。本文从这三个角度深入分析DeepS...

AI快讯

4个月前

《Ultra-Scale Playbook》是一份关于超大规模模型训练的实战指南，耗时6个月完成，涵盖了现代LLM训练的关键环节，如5D并行化技术、ZeRO优化策略、CUDA内核优...

AI快讯

4个月前

随着Transformer技术的快速发展，AI服务器和ASIC（专用集成电路）正成为推动人工智能落地的关键力量。TrendForce集邦咨询预测，2025年全球AI服务器出货量将年...

AI快讯

4个月前

随着AI技术的快速发展，ASIC（专用集成电路）在AI服务器市场中的地位日益凸显。TrendForce集邦咨询预测，2025年全球AI服务器出货量将年增近28%，DeepSeek驱动...

AI快讯

4个月前