Robotic World Model (RWM) 是一种用于机器人领域的神经网络模拟器,旨在优化策略。它通过双重自回归机制和自监督训练实现长期预测,无需依赖特定领域的知识偏见。RWM 结合 MBPO-PPO 方法,支持在模拟和真实环境中训练和部署策略,特别是在复杂、部分可观察和随机动态环境下表现出色。