标签:Open Reasoner Zero

阶跃星辰开源大模型技术:Open Reasoner Zero引领AI新潮流

阶跃星辰与清华大学联合发布Open Reasoner Zero (ORZ)模型,该模型在响应长度上仅需约17%的训练步骤即可赶上DeepSeek-R1-Zero 671B。DeepSeek开源了推理模型...

Open Reasoner Zero (ORZ):推理模型训练的革命性突破

Open Reasoner Zero (ORZ)模型在推理训练领域取得重大突破,仅需1/30的训练步骤即可媲美DeepSeek-R1-Zero的性能。阶跃星辰与清华大学联合发布,沈向洋等AI领...