r1_vlm是一个专为训练视觉语言模型(VLM)设计的高效工具包,旨在简化模型训练过程并提升任务执行效率。该工具包采用了基于GRPO的高效训练方法,在解码任务上能够达到96%的准确率,支持多种任务,包括信息解码和数字识别。