MME-CoT是一个为多模态大模型提供全面推理能力评估的基准测试工具。它覆盖了数学、科学、OCR等六大领域,通过提出三项新指标,深度剖析模型的推理质量、鲁棒性和效率,揭示模型在视觉推理任务中的表现,从而助力多模态模型的发展。