PokéChamp 是一款专为宝可梦战斗设计的 Minimax 智能体,利用大型语言模型(LLM)增强其性能,无需特定训练。它在 Pokémon Showdown 平台上达到专家级人类玩家的水平,胜率高达 76% 对抗最佳现有 LLM 机器人。PokéChamp 集成了 LLM 到行动采样、对手建模和价值函数估计中,改善搜索效率并处理部分可观察性。它还编译了超过 300 万场比赛的数据集,包括超过 50 万高 Elo 比赛,供研究使用。