强化学习 | 第 14 页

长文本推理的革新：月之暗面与DeepSeek的技术竞逐

月之暗面与DeepSeek在长文本推理领域展开激烈竞争，双方分别提出MoBA和NSA注意力机制，旨在提升大语言模型处理长上下文的能力。月之暗面计划加强多模态和强化...

AI快讯

4个月前

月之暗面将“持续拿到SOTA结果”作为核心目标，并计划在2025年加强多模态和长文本推理能力。与DeepSeek在闭源与开源、预训练与蒸馏技术等方面的差异，引发了业...

AI快讯

4个月前

DeepSeek通过性能蒸馏技术，将大模型的知识迁移到小模型中，显著提升了车端模型的性能。这种技术在智能座舱和智能驾驶领域展现出巨大潜力，结合强化学习，推...

AI快讯

4个月前

小鹏汽车董事长何小鹏在小鹏X9海外发运仪式上透露，小鹏汽车正通过强化学习、世界模型和蒸馏能力等技术，推动人形机器人向L3级别迈进。他表示，小鹏有望成为...

AI快讯

4个月前

小鹏汽车董事长何小鹏在小鹏X9海外发运仪式上透露，小鹏汽车正致力于推动人形机器人技术迈向L3级别，并有望成为中国最早量产L3机器人的企业之一。通过将世界...

AI快讯

4个月前

在今年的ICML顶会上，Genie作为基础世界模型备受关注。本文将探讨Genie的技术突破、应用前景及其在深度学习领域的意义，同时分析其在视频生成和大模型中的潜力。

AI快讯

4个月前

苹果通过GIGAFLOW框架，利用强化学习自博弈技术，在10天内生成16亿公里模拟数据，无需真实世界数据即可训练出高效、通用的自动驾驶策略，展现了其在自动驾驶...

AI快讯

4个月前

中国在人工智能研究领域迅速崛起，全球顶尖AI学会ICML 2024年的论文录用情况显示，中国高校在作者数量上紧追美国。本文从ICML的角度，深入分析中国在强化学习...

AI快讯

4个月前

中国在AI研究领域迅速崛起，ICLR 2024论文录用情况显示，中国高校在作者数量上紧追美国。本文深入分析中国在强化学习、具身智能等领域的突破性研究，探讨中美...

AI快讯

4个月前

本文探讨了人形机器人强化学习训练框架Humanoid-Gym的开源及其在AI领域的重要性。同时，文章还涵盖了SK海力士的芯片封装投资、微软即将推出的AI PC，以及高通...

AI快讯

4个月前