OvercookedGPT是一个OpenAI Gym环境,旨在评估大型语言模型(如GPT-4和Claude)在动态多智能体环境中的长期推理和任务规划能力。它提供了一个交互式的2D游戏环境,支持多种LLM,并生成时间序列任务,适用于复杂场景下的AI模型训练与评估。