UnifiedReward是首个统一的多模态理解和生成评估奖励模型,支持成对排名和点式评分,旨在助力视觉模型的偏好对齐。该项目首次实现了图像、视频生成与理解的全面覆盖,提供了完整的训练代码和数据集,并在多个基准测试中表现卓越。