模型蒸馏 | AI-magic

大型语言模型（LLM）的竞争格局与未来趋势

本文探讨了大型语言模型（LLM）的竞争格局，分析了合成数据、模型蒸馏和提示工程等关键技术。文章还梳理了多家公司在合成数据领域的技术积累和业务应用，并展...

AI快讯

3个月前

李飞飞团队s1模型：低成本AI训练的突破与挑战

李飞飞团队以不到50美元的成本训练出名为s1的AI推理模型，该模型在数学和编码测试中表现优异。s1模型的训练基于阿里云通义千问模型进行监督微调，展示了低成...

AI快讯

3个月前

强化学习在大型语言模型中的应用与挑战

本文探讨了强化学习（RL）在大型语言模型（LLM）中的应用，特别是DeepSeek R1模型的研究进展。通过结合监督微调（SFT）和RL，模型在可验证任务中表现出色，但...

AI快讯

3个月前

DeepSeek-R1：高性能AI推理模型的革命性突破

DeepSeek-R1 是一款由中国杭州深度求索公司开发的高性能AI推理模型，专注于数学、代码和自然语言推理任务。该模型通过强化学习和多阶段训练技术实现高效推理...

AI快讯

3个月前

中小公有云厂商在AI领域的崛起：流量外溢与科研云的未来

本文探讨了中小公有云厂商在AI领域的受益逻辑，重点分析了流量外溢、模型蒸馏适配和资金容量博弈对行业的影响。通过优刻得、首都在线和并行科技等公司的案例...

AI快讯

4个月前

模型蒸馏：AI领域中小公有云厂商的崛起之路

本文探讨了中小公有云厂商在AI领域的受益逻辑，重点分析了模型蒸馏、AI推理服务、边缘计算和科研云的应用。通过优刻得、首都在线和并行科技等公司的案例，揭...

AI快讯

4个月前

强化学习：从基础到前沿的技术探索与应用实践

本文深入探讨强化学习（RL）的核心概念、技术框架及其在人工智能领域的应用。从基础算法到前沿技术如RLHF和模型蒸馏，文章全面解析了强化学习的最新进展与未...

AI快讯

4个月前

中间回归器：从复杂模型到轻量级模型的知识迁移

本文深入探讨了中间回归器在模型蒸馏中的应用，介绍了如何通过PyTorch官方教程将复杂模型的知识迁移到轻量级模型中，提升小模型的性能。文章涵盖了中间回归器...

AI快讯

4个月前

DeepSeek-R1：AI推理能力的革命性突破与CoT数据的应用

DeepSeek-R1通过纯强化学习技术显著提升了AI模型的推理能力，开创了无需监督微调的新范式。其创新的CoT数据生成与蒸馏技术，为垂域大模型的开发提供了强大支...

AI快讯

4个月前

探索 SmolVLM-256M：世界上最小的视觉语言模型

Hugging Face 发布的 SmolVLM-256M 是世界上最小的视觉语言模型，基于 SigLIP 图片编码器和 SmolLM2 文本编码器，能在移动平台上轻松运行，仅需不到 1GB 的 G...

AI快讯

4个月前

标签：模型蒸馏

大型语言模型（LLM）的竞争格局与未来趋势

李飞飞团队s1模型：低成本AI训练的突破与挑战

强化学习在大型语言模型中的应用与挑战

DeepSeek-R1：高性能AI推理模型的革命性突破

中小公有云厂商在AI领域的崛起：流量外溢与科研云的未来

模型蒸馏：AI领域中小公有云厂商的崛起之路

强化学习：从基础到前沿的技术探索与应用实践

中间回归器：从复杂模型到轻量级模型的知识迁移

DeepSeek-R1：AI推理能力的革命性突破与CoT数据的应用

探索 SmolVLM-256M：世界上最小的视觉语言模型

通过字节跳动免费使用满血可联网DeepSeek R1

现在注册，立即送145元代金券