Subjects200K 是 OmniControl 项目引入的大规模数据集,包含 20 万对图像。每个样本包括主体描述、左右 512x512 图像、对应的文本描述以及合并的 1024x512 图像。该数据集旨在提供一致的图像主体和变化的场景背景,用于训练和评估图像生成模型,增强场景理解和背景变化能力,以及开发图像文本对齐算法等研究。