OpenRLHF扩展

LMM-R1 是一个为多模态任务打造的高性能强化学习训练框架，旨在扩展 OpenRLHF 框架，支持 LMM（Large Multimodal Models）强化学习（RL）训练，以复现 DeepSeek-R1 在多模态任务上的表现。该框架集成了多种优化技术，显著提升了训练速度和模型生成效率，并支持大规模模型的训练和扩展。

LMM-R1OpenRLHF扩展多模态强化学习高性能训练框架

AI-magic收录了大量国内外AI工具箱，包括AI写作、图像、视频、音频、编程等各类AI工具，以及常用的AI学习、技术、和模型等信息，让你轻松加入人工智能浪潮。