HaploVLM是腾讯开发的基于单一Transformer架构的多模态AI模型,支持文本、图像和视频的跨模态理解与自回归响应生成。通过优化训练配方降低资源消耗,适配Ascend NPU/GPU硬件,具备细粒度感知和逻辑推理能力,适用于智能客服、内容分析等场景。