所有AI工具AI学习网站AI开发框架AI开源项目

OvercookedGPT开源项目 – 多智能体任务规划评估环境

OvercookedGPT是一个OpenAI Gym环境,旨在评估大型语言模型(如GPT-4和Claude)在动态多智能体环境中的长期推理和任务规划能力。它提供了一个交互式的2D游戏环境,支持多种LLM,并...

标签:

AI交流(进群备注:OvercookedGPT)

OvercookedGPT是一个OpenAI Gym环境,旨在评估大型语言模型(如GPT-4和Claude)在动态多智能体环境中的长期推理和任务规划能力。它提供了一个交互式的2D游戏环境,支持多种LLM,并生成时间序列任务,适用于复杂场景下的AI模型训练与评估。

OvercookedGPT的特点:

  • 1. 交互式2D游戏环境
  • 2. 支持多种LLM,包括GPT-4和Claude
  • 3. 集中生成时间序列任务
  • 4. 动态多智能体设置
  • 5. 长期推理和任务规划评估

OvercookedGPT的功能:

  • 1. 评估LLM在复杂多智能体环境中的表现
  • 2. 训练和评估AI模型的任务规划与协调能力
  • 3. 模拟需要长期推理的真实世界场景
  • 4. AI和机器学习的研究与开发

相关导航

暂无评论

暂无评论...