ERQA(Embodied Reasoning Question Answer)是由Google DeepMind开源的机器人领域多模态推理问答基准,包含400个真实场景问题,涵盖空间推理和世界知识。它通过文本和图像等多模态数据,以多选题形式评估机器人模型对复杂环境的理解能力,支持Gemini和OpenAI API的评估框架,数据以TFRecord格式存储,适用于学术研究和工业应用。