VideoReward模型

该项目通过构建大规模人类偏好数据集和视频奖励模型，利用人工反馈改善视频生成模型，解决了运动不平滑、视频与提示错位等问题。项目包含182,000个跨多维度注释的数据集，开发了多维视频奖励模型VideoReward，并提出了三种基于流的对齐算法（Flow-DPO、Flow-RWR、Flow-NRG），显著提升了视频的视觉质量、运动质量和文本对齐度。

VideoReward模型人类反馈优化视频对齐算法视频生成质量提升

AI-magic收录了大量国内外AI工具箱，包括AI写作、图像、视频、音频、编程等各类AI工具，以及常用的AI学习、技术、和模型等信息，让你轻松加入人工智能浪潮。