iRe-VLA Framework 是一个通过在线强化学习(RL)和监督学习(SL)迭代来提升视觉-语言-行动模型(VLA)在机器人控制任务中性能和泛化能力的框架。它兼顾了训练稳定性和计算效率,在多个模拟和真实世界基准测试中表现优异,如MetaWorld、FrankaKitchen和真实世界Panda操作任务。