在人工智能领域,开源大模型正逐渐成为技术创新的重要推动力。DeepSeek的开源推理模型RL训练方法,以及阶跃星辰与清华大学联合发布的Open Reasoner Zero (ORZ)模型,标志着中国在AI技术上的又一次重大突破。
DeepSeek的技术创新
DeepSeek的开源推理模型RL训练方法,仅需1/30的训练步骤即可达到与DeepSeek-R1-Zero相同尺寸的蒸馏Qwen模型的性能。这一技术的推出,不仅大大降低了训练成本,还提高了模型的效率和性能。DeepSeek的成功,不仅是技术上的突破,更是开源社区的一次胜利。正如沈向洋在2025全球开发者先锋大会上所说,DeepSeek的开源让更多人有机会在这样的模型上做更多了不起的事情。
Open Reasoner Zero (ORZ)模型的发布
阶跃星辰与清华大学联合发布的Open Reasoner Zero (ORZ)模型,在响应长度上仅需约17%的训练步骤即可赶上DeepSeek-R1-Zero 671B。这一模型的发布,进一步证明了中国在AI技术上的领先地位。ORZ模型的出现,不仅为AI领域带来了新的可能性,也为中国在全球AI竞争中赢得了更多的主动权。
开源与闭源的平衡
在开源与闭源的商业模式上,沈向洋提出了独到的见解。他认为,开源和闭源之间不需要完全从对立的面来看,未来的商业模式,总是要想出一个平衡开源和闭源的方式。DeepSeek的成功,正是这种平衡的体现。通过开源,DeepSeek不仅让更多人受益,也为自身赢得了更多的商业机会。
行业应用与未来展望
宝兰德公司已经成功接入DeepSeek、QWen、ChatGLM、文心一言等通用大模型,并应用于行业用户打造面向垂直领域的AI Agent应用。这一成功案例,展示了开源大模型在实际应用中的巨大潜力。未来,随着更多企业和研究机构的加入,开源大模型将在更多领域发挥重要作用,推动AI技术的进一步发展。
结语
DeepSeek与Qwen的技术突破,不仅展示了中国在AI技术上的领先地位,也为全球AI技术的发展提供了新的动力。通过开源,更多人和企业将有机会参与到AI技术的创新中来,共同推动AI技术的进步。正如沈向洋所言,开源这件事情会越做越好,中国的团队一定会引领开源潮流。