所有AI工具AI学习网站AI开发框架AI开源项目

DIAMOND开源项目 – 基于扩散模型的强化学习代理

DIAMOND (DIffusion As a Model Of eNvironment Dreams) 是一个开源的强化学习代理项目,基于扩散世界模型训练,能够实时生成游戏环境、人物动作和装备,支持在雅达利和 CSGO 等游...

标签:

AI交流(进群备注:DIAMOND)

DIAMOND (DIffusion As a Model Of eNvironment Dreams) 是一个开源的强化学习代理项目,基于扩散世界模型训练,能够实时生成游戏环境、人物动作和装备,支持在雅达利和 CSGO 等游戏中模拟 3D 环境。项目专为 CS:GO 设计,使用扩散模型为 CS:GO 游戏创建一个世界模型,支持人类玩家的行为模拟和互动。训练使用了 CS:GO 的 Dust2 地图上收集的 5.5 百万帧数据,共约 87 小时的游戏记录,数据集超过 660GB。项目提供了详细的训练数据处理脚本和配置指南,使用户能够在本地训练环境中快速部署模型;完整训练在 RTX 4090 显卡上需要约 12 天。

DIAMOND的特点:

  • 1. 实时生成游戏环境、人物动作和装备,无需预置 3D 模型
  • 2. 在扩散世界模型中训练的强化学习代理
  • 3. 能够模拟 3D 环境,支持雅达利和 CSGO 等游戏
  • 4. 开源项目,用户可以自行部署
  • 5. 目前支持在 NVIDIA 3090 显卡上以 10 帧的速度运行
  • 6. 专为 CS:GO 设计,支持人类玩家的行为模拟和互动
  • 7. 大规模数据集训练,使用 CS:GO 的 Dust2 地图上收集的 5.5 百万帧数据
  • 8. 快速运行和编译优化,默认配置在 CUDA GPU 上表现最佳
  • 9. 灵活的配置和参数调整,用户可以通过编辑配置文件自定义采样参数
  • 10. 训练过程和环境配置指南,提供详细的训练数据处理脚本和配置指南
  • 11. NeurIPS 2024 展示,展示了视觉细节对世界模型质量的重要性

DIAMOND的功能:

  • 1. 使用鼠标和键盘玩实时生成的 CS:GO
  • 2. 部署并运行在 NVIDIA 3090 显卡上
  • 3. 研究和开发强化学习代理
  • 4. 模拟和测试不同的 3D 游戏环境
  • 5. 自定义和扩展 DIAMOND 的功能
  • 6. 用于训练和模拟 CS:GO 游戏中的玩家行为,生成逼真的游戏环境
  • 7. 通过编辑配置文件自定义采样参数,优化模型生成速度和生成质量
  • 8. 在本地训练环境中快速部署模型,利用大规模数据集进行强化学习训练
  • 9. 在 CUDA GPU 上运行模型,或在 Mac 上使用 MPS 后端进行 CPU 回退
  • 10. 生成高质量的游戏画面,用于研究和开发游戏 AI 和世界模型

相关导航

暂无评论

暂无评论...