DIAMOND开源项目 – 基于扩散模型的强化学习代理
DIAMOND (DIffusion As a Model Of eNvironment Dreams) 是一个开源的强化学习代理项目,基于扩散世界模型训练,能够实时生成游戏环境、人物动作和装备,支持在雅达利和 CSGO 等游戏中模拟 3D 环境。项目专为 CS:GO 设计,使用扩散模型为 CS:GO 游戏创建一个世界模型,支持人类玩家的行为模拟和互动。训练使用了 CS:GO 的 Dust2 地图上收集的 5.5 百万帧数据,共约 87 小时的游戏记录,数据集超过 660GB。项目提供了详细的训练数据处理脚本和配置指南,使用户能够在本地训练环境中快速部署模型;完整训练在 RTX 4090 显卡上需要约 12 天。