标签:强化学习

长文本推理的革新:月之暗面与DeepSeek的技术竞逐

月之暗面与DeepSeek在长文本推理领域展开激烈竞争,双方分别提出MoBA和NSA注意力机制,旨在提升大语言模型处理长上下文的能力。月之暗面计划加强多模态和强化...

月之暗面与DeepSeek:多模态与长文本推理的技术竞争

月之暗面将“持续拿到SOTA结果”作为核心目标,并计划在2025年加强多模态和长文本推理能力。与DeepSeek在闭源与开源、预训练与蒸馏技术等方面的差异,引发了业...

性能蒸馏技术:DeepSeek在AI领域的创新与应用

DeepSeek通过性能蒸馏技术,将大模型的知识迁移到小模型中,显著提升了车端模型的性能。这种技术在智能座舱和智能驾驶领域展现出巨大潜力,结合强化学习,推...

小鹏汽车强化学习技术赋能人形机器人,迈向L3时代

小鹏汽车董事长何小鹏在小鹏X9海外发运仪式上透露,小鹏汽车正通过强化学习、世界模型和蒸馏能力等技术,推动人形机器人向L3级别迈进。他表示,小鹏有望成为...

小鹏汽车的世界模型:推动人形机器人迈向L3时代

小鹏汽车董事长何小鹏在小鹏X9海外发运仪式上透露,小鹏汽车正致力于推动人形机器人技术迈向L3级别,并有望成为中国最早量产L3机器人的企业之一。通过将世界...

Genie:基础世界模型的突破与未来

在今年的ICML顶会上,Genie作为基础世界模型备受关注。本文将探讨Genie的技术突破、应用前景及其在深度学习领域的意义,同时分析其在视频生成和大模型中的潜力。

苹果GIGAFLOW:强化学习自博弈技术引领自动驾驶新革命

苹果通过GIGAFLOW框架,利用强化学习自博弈技术,在10天内生成16亿公里模拟数据,无需真实世界数据即可训练出高效、通用的自动驾驶策略,展现了其在自动驾驶...

中国AI研究崛起:从ICML看全球竞争格局

中国在人工智能研究领域迅速崛起,全球顶尖AI学会ICML 2024年的论文录用情况显示,中国高校在作者数量上紧追美国。本文从ICML的角度,深入分析中国在强化学习...

中国AI研究紧追美国:ICLR 2024论文录用背后的技术突破

中国在AI研究领域迅速崛起,ICLR 2024论文录用情况显示,中国高校在作者数量上紧追美国。本文深入分析中国在强化学习、具身智能等领域的突破性研究,探讨中美...

人形机器人强化学习训练框架Humanoid-Gym的开源与AI技术新动态

本文探讨了人形机器人强化学习训练框架Humanoid-Gym的开源及其在AI领域的重要性。同时,文章还涵盖了SK海力士的芯片封装投资、微软即将推出的AI PC,以及高通...
1 12 13 14 15 16 18