该项目由Apple机器学习团队开发,通过大规模自弈(self-play)在模拟环境中训练自动驾驶策略,完全无需人类驾驶数据。研究使用高效模拟平台GigaFlow和优势过滤算法,模拟了16亿公里驾驶经验,在三大基准测试中达到最先进水平,驾驶行为自然且鲁棒性极高(平均17.5年发生一次事故)。