LLaVA-OneVision 是一个综合性项目,结合了大型数据集和多模态模型(LMMs),旨在推进多模态任务的研究与应用。项目包括一个名为 LLaVA-OneVision-Data 的数据集,特别用于训练模型,并计划开放用于多模态任务的研究与开发。该项目的核心目标是构建通用的视觉语言助手,能够完成各种计算机视觉任务。