超摩尔定律：AI推理与开源大模型的技术革命

0 0

引言

摩尔定律曾预言，集成电路上可容纳的晶体管数量每两年翻一番。然而，随着AI技术的飞速发展，尤其是推理AI和开源大模型的崛起，AI领域正在经历一场超摩尔定律的技术革命。本文将从英伟达Blackwell架构的革新、DeepSeek R1的开源影响，以及大模型研发成本的降低趋势三个方面，探讨AI技术如何推动行业变革和技术平权。

英伟达Blackwell架构：推理AI的里程碑

英伟达最新发布的Blackwell架构，专为推理AI设计，将推理AI模型的Token吞吐量提升25倍，成本降低20倍。这一革命性架构不仅支持从预训练到推理的全流程，还通过CUDA可编程架构加速了所有AI模型及4,400多个应用。Blackwell架构的推出，标志着AI推理技术进入了一个全新的时代。

DeepSeek R1：开源大模型的先锋

DeepSeek R1的开源，不仅点燃了全球的热情，还推动了AI领域的诸多突破性进展。通过微调、蒸馏等低成本创新技术，开源大模型正在挑战大模型的烧钱逻辑。例如，美国斯坦福大学和华盛顿大学的研究团队仅以几十美元成本，开发出性能可媲美前沿推理模型的AI模型S1。这一进展验证了DeepSeek R1论文中提出的观点：利用大模型进行知识蒸馏可有效提升小模型的推理性能。

大模型研发成本的降低趋势

随着技术的进步，大模型研发成本正逐年降低。百度2024年宣布，其文心大模型推理成本已降至2023年3月版本的1%，算法训练效率提升到原来的5.1倍，推理性能提升105倍。清华大学和面壁智能2024年推出MiniCPM最新端侧模型，只需要几十亿参数便能够实现GPT-4o水平的能力，可在手机上高效运行。这些进展表明，大模型的能力密度正随时间呈指数级增强，未来应继续推进计算系统的智能化，不断追求更高的能力密度。