视觉语言模型集成