标签:DeepSeek-R1
DeepSeek-R1:高性能AI推理模型的数学与代码推理能力解析
DeepSeek-R1 是由中国杭州深度求索公司开发的高性能AI推理模型,专注于数学、代码和自然语言推理任务。通过强化学习技术训练,该模型在多个基准测试中表现出...
DeepSeek-R1:AI推理模型的新标杆,AIME 2024中的卓越表现
DeepSeek-R1 是由中国杭州深度求索公司开发的高性能AI推理模型,专注于数学、代码和自然语言推理任务。该模型通过强化学习技术进行训练,并在AIME 2024等基准...
监督微调(SFT)在大型语言模型中的应用与挑战
本文深入探讨了监督微调(SFT)在大型语言模型(LLM)中的应用及其与强化学习(RL)的结合。通过分析DeepSeek R1的技术研讨,我们揭示了SFT如何提升模型的可...
大型语言模型的进化之路:从Transformer到DeepSeek-R1
本文回顾了大型语言模型(LLM)从2017年Transformer架构的引入到2025年DeepSeek-R1的演变历程。文章探讨了LLM的关键技术突破,包括自注意力机制、生成能力、...
DeepSeek-R1 与 o1-mini:AI 推理模型的巅峰对决
DeepSeek-R1 是由中国深度求索公司开发的高性能AI推理模型,专注于数学、代码和自然语言推理任务。通过强化学习技术,该模型在多个基准测试中表现出色,性能...
强化学习在大型语言模型中的应用与挑战
本文探讨了强化学习(RL)在大型语言模型(LLM)中的应用,特别是DeepSeek R1模型的研究进展。通过结合监督微调(SFT)和RL,模型在可验证任务中表现出色,但...
DeepSeek R1:强化学习与语言模型的革命性结合
Hugging Face组织的DeepSeek R1深度技术研讨揭示了强化学习在大型语言模型中的突破性应用。通过结合监督微调和GRPO算法,DeepSeek R1实现了高效的模型优化与...
DeepSeek-R1:高性能AI推理模型的革命性突破
DeepSeek-R1 是一款由中国杭州深度求索公司开发的高性能AI推理模型,专注于数学、代码和自然语言推理任务。该模型通过强化学习和多阶段训练技术实现高效推理...
DeepSeek-R1:中国AI模型的崛起与全球影响
DeepSeek-R1 是由中国杭州深度求索公司开发的一款高性能AI推理模型,专注于数学、代码和自然语言推理任务。该模型通过强化学习技术进行训练,并在多个基准测...
DeepSeek-R1:中国AI技术的崛起与全球影响
本文探讨了杭州深度求索发布的DeepSeek-R1大模型如何在全球AI竞赛中脱颖而出,打破西方技术封锁,推动AI技术民主化。文章详细分析了DeepSeek-R1的技术创新、...