标签:强化学习
长文本推理的革新:月之暗面与DeepSeek的技术竞逐
月之暗面与DeepSeek在长文本推理领域展开激烈竞争,双方分别提出MoBA和NSA注意力机制,旨在提升大语言模型处理长上下文的能力。月之暗面计划加强多模态和强化...
月之暗面与DeepSeek:多模态与长文本推理的技术竞争
月之暗面将“持续拿到SOTA结果”作为核心目标,并计划在2025年加强多模态和长文本推理能力。与DeepSeek在闭源与开源、预训练与蒸馏技术等方面的差异,引发了业...
性能蒸馏技术:DeepSeek在AI领域的创新与应用
DeepSeek通过性能蒸馏技术,将大模型的知识迁移到小模型中,显著提升了车端模型的性能。这种技术在智能座舱和智能驾驶领域展现出巨大潜力,结合强化学习,推...
小鹏汽车强化学习技术赋能人形机器人,迈向L3时代
小鹏汽车董事长何小鹏在小鹏X9海外发运仪式上透露,小鹏汽车正通过强化学习、世界模型和蒸馏能力等技术,推动人形机器人向L3级别迈进。他表示,小鹏有望成为...
小鹏汽车的世界模型:推动人形机器人迈向L3时代
小鹏汽车董事长何小鹏在小鹏X9海外发运仪式上透露,小鹏汽车正致力于推动人形机器人技术迈向L3级别,并有望成为中国最早量产L3机器人的企业之一。通过将世界...
Genie:基础世界模型的突破与未来
在今年的ICML顶会上,Genie作为基础世界模型备受关注。本文将探讨Genie的技术突破、应用前景及其在深度学习领域的意义,同时分析其在视频生成和大模型中的潜力。
苹果GIGAFLOW:强化学习自博弈技术引领自动驾驶新革命
苹果通过GIGAFLOW框架,利用强化学习自博弈技术,在10天内生成16亿公里模拟数据,无需真实世界数据即可训练出高效、通用的自动驾驶策略,展现了其在自动驾驶...
中国AI研究崛起:从ICML看全球竞争格局
中国在人工智能研究领域迅速崛起,全球顶尖AI学会ICML 2024年的论文录用情况显示,中国高校在作者数量上紧追美国。本文从ICML的角度,深入分析中国在强化学习...
中国AI研究紧追美国:ICLR 2024论文录用背后的技术突破
中国在AI研究领域迅速崛起,ICLR 2024论文录用情况显示,中国高校在作者数量上紧追美国。本文深入分析中国在强化学习、具身智能等领域的突破性研究,探讨中美...
人形机器人强化学习训练框架Humanoid-Gym的开源与AI技术新动态
本文探讨了人形机器人强化学习训练框架Humanoid-Gym的开源及其在AI领域的重要性。同时,文章还涵盖了SK海力士的芯片封装投资、微软即将推出的AI PC,以及高通...