Flashrl 是一个轻量级强化学习库,旨在通过极简代码(约200行)实现快速开发,支持大规模并行环境(单次运行可达千万级步骤)。其核心设计强调性能优化和开发者友好性,提供高效的 Learner 架构、tensorboard 日志支持以及 Cython 实现的环境,适合学术研究和工业应用。