PaliGemma 2是Google发布的新一代视觉模型,主要在OCR、图像分割和问题回答等方面进行了显著增强。该模型能够更准确地识别图像中的文字,更精细地分割图像中的对象,并更智能地回答与图像内容相关的问题。