DeepSeek-R1 | 第 6 页

DeepSeek-R1：高性能AI推理模型的数学与代码推理能力解析

DeepSeek-R1 是由中国杭州深度求索公司开发的高性能AI推理模型，专注于数学、代码和自然语言推理任务。通过强化学习技术训练，该模型在多个基准测试中表现出...

AI快讯

3个月前

DeepSeek-R1 是由中国杭州深度求索公司开发的高性能AI推理模型，专注于数学、代码和自然语言推理任务。该模型通过强化学习技术进行训练，并在AIME 2024等基准...

AI快讯

3个月前

本文深入探讨了监督微调（SFT）在大型语言模型（LLM）中的应用及其与强化学习（RL）的结合。通过分析DeepSeek R1的技术研讨，我们揭示了SFT如何提升模型的可...

AI快讯

3个月前

本文回顾了大型语言模型（LLM）从2017年Transformer架构的引入到2025年DeepSeek-R1的演变历程。文章探讨了LLM的关键技术突破，包括自注意力机制、生成能力、...

AI快讯

3个月前

DeepSeek-R1 是由中国深度求索公司开发的高性能AI推理模型，专注于数学、代码和自然语言推理任务。通过强化学习技术，该模型在多个基准测试中表现出色，性能...

AI快讯

3个月前

本文探讨了强化学习（RL）在大型语言模型（LLM）中的应用，特别是DeepSeek R1模型的研究进展。通过结合监督微调（SFT）和RL，模型在可验证任务中表现出色，但...

AI快讯

3个月前

Hugging Face组织的DeepSeek R1深度技术研讨揭示了强化学习在大型语言模型中的突破性应用。通过结合监督微调和GRPO算法，DeepSeek R1实现了高效的模型优化与...

AI快讯

3个月前

DeepSeek-R1 是一款由中国杭州深度求索公司开发的高性能AI推理模型，专注于数学、代码和自然语言推理任务。该模型通过强化学习和多阶段训练技术实现高效推理...

AI快讯

3个月前

DeepSeek-R1 是由中国杭州深度求索公司开发的一款高性能AI推理模型，专注于数学、代码和自然语言推理任务。该模型通过强化学习技术进行训练，并在多个基准测...

AI快讯

3个月前

本文探讨了杭州深度求索发布的DeepSeek-R1大模型如何在全球AI竞赛中脱颖而出，打破西方技术封锁，推动AI技术民主化。文章详细分析了DeepSeek-R1的技术创新、...

AI快讯

3个月前