ACT-Bench 是一个开源的评估框架,专注于自动驾驶世界模型的行动可控性。它帮助研究人员量化模型在给定特定轨迹时生成驾驶场景的能力,例如如何根据预设路径生成逼真的驾驶视频。该框架包括一个基于 nuScenes 的大型数据集和一个名为 Terra 的基准模型,用于评估模型的行动保真度。ACT-Bench 通过生成视频并与地面真相比较来量化模型的行动可控性,支持研究人员测试其自己的世界模型,并与基准模型进行比较。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型