开源与闭源竞速：DeepSeek如何重塑AI技术格局

0 0

开源与闭源的双轨竞速

当前，全球大模型技术已形成“闭源垄断”与“开源突围”的双轨竞速形态。以OpenAI、Google为代表的头部企业通过技术高墙构建商业壁垒，凭借顶尖模型能力主导市场话语权，但其封闭生态也导致开发者准入门槛高。DeepSeek以开源为矛，正在打破这一局面。

开源与闭源竞速：DeepSeek如何重塑AI技术格局

DeepSeek的开源策略

DeepSeek通过公开代码与技术报告揭示前沿大模型关键技术细节，随后启动“开源周”进一步开源了专门为Hopper高性能AI芯片设计的先进技术FlashMLA、用于MoE模型训练和推理的EP通信库DeepEP以及DualPipe、EPLB、profile-data等。这些开源举措不仅证明了开源模型性能可媲美顶尖闭源系统，更构建起开发者深度参与的技术飞轮。

开源与闭源竞速：DeepSeek如何重塑AI技术格局

DeepSeek的核心技术

DeepSeek的爆红，更多归功于其在语言处理能力上的卓越表现，尤其是在写作方面，这与普通人日常使用体验息息相关。DeepSeek彻底公开了所有技术，意味着后续的研究者无需从零开始，很多方法已经明确可循。

强化学习的突破

DeepSeek R1的训练很有意思，比如仅凭RL就激发出推理能力。GRPO（Group Relative Policy Optimization）算法比传统的PPO（Proximal Policy Optimization）算法更快、更省算力。传统强化学习通常需要使用四个模型，而GRPO以及该团队使用的Rule-Based Reward Model将其减少至一个或两个模型，从而大大节省了计算资源。