标签:链式思维

DeepSeek-R1-Zero:AI模型的新里程碑与国产算力的崛起

DeepSeek发布的DeepSeek-R1-Zero模型通过强化学习实现链式思维,推动国产AI算力卡的迭代与升级。该模型的成功部署不仅提升了AI推理能力,还为国产算力板块和...

DeepSeek-R1-Zero:无需监督微调的强化学习新突破

DeepSeek-R1-Zero通过直接应用强化学习,绕过了监督微调,成功探索链式思维解决复杂问题。这一突破不仅验证了仅通过强化学习即可激励大语言模型的推理能力,...