#
引言
摩尔定律曾预言,集成电路上可容纳的晶体管数量每两年翻一番。然而,随着AI技术的飞速发展,尤其是推理AI和开源大模型的崛起,AI领域正在经历一场超摩尔定律的技术革命。本文将从英伟达Blackwell架构的革新、DeepSeek R1的开源影响,以及大模型研发成本的降低趋势三个方面,探讨AI技术如何推动行业变革和技术平权。
英伟达Blackwell架构:推理AI的里程碑
英伟达最新发布的Blackwell架构,专为推理AI设计,将推理AI模型的Token吞吐量提升25倍,成本降低20倍。这一革命性架构不仅支持从预训练到推理的全流程,还通过CUDA可编程架构加速了所有AI模型及4,400多个应用。Blackwell架构的推出,标志着AI推理技术进入了一个全新的时代。
DeepSeek R1:开源大模型的先锋
DeepSeek R1的开源,不仅点燃了全球的热情,还推动了AI领域的诸多突破性进展。通过微调、蒸馏等低成本创新技术,开源大模型正在挑战大模型的烧钱逻辑。例如,美国斯坦福大学和华盛顿大学的研究团队仅以几十美元成本,开发出性能可媲美前沿推理模型的AI模型S1。这一进展验证了DeepSeek R1论文中提出的观点:利用大模型进行知识蒸馏可有效提升小模型的推理性能。
大模型研发成本的降低趋势
随着技术的进步,大模型研发成本正逐年降低。百度2024年宣布,其文心大模型推理成本已降至2023年3月版本的1%,算法训练效率提升到原来的5.1倍,推理性能提升105倍。清华大学和面壁智能2024年推出MiniCPM最新端侧模型,只需要几十亿参数便能够实现GPT-4o水平的能力,可在手机上高效运行。这些进展表明,大模型的能力密度正随时间呈指数级增强,未来应继续推进计算系统的智能化,不断追求更高的能力密度。
技术平权:开源大模型的普惠性
开源大模型的兴起,降低了AI技术的准入门槛,加速了金融、医疗等领域的智能化升级。例如,新网银行通过开源大模型实现了智慧平权,将通用人工智能应用于整体经营活动。光大信托普惠金融部副总经理祝世虎指出,开源大模型的兴起,再次实现了算力、数据与模型的新平衡,推动了金融行业的智能化进程。
结论
AI技术通过推理AI和开源大模型,正在实现超摩尔定律的突破。英伟达Blackwell架构的革新、DeepSeek R1的开源影响,以及大模型研发成本的降低趋势,揭示了AI推理技术如何推动行业变革和技术平权。未来,随着技术的不断进步,AI将更加普惠,真正实现“人人皆可被精准服务”的愿景。
表格:大模型研发成本降低趋势
年份 | 模型名称 | 推理成本降低 | 训练效率提升 | 推理性能提升 |
---|---|---|---|---|
2023 | 文心大模型 | 100% | 5.1倍 | 105倍 |
2024 | MiniCPM | 10% | 2倍 | 50倍 |
通过以上分析,我们可以看到,AI技术正在以超摩尔定律的速度,推动着各行各业的变革和创新。