mllm-mmrotate是一个专注于空中目标检测的项目,通过多模态语言模型(MLLM)为无人机和其他空中设备提供精确的物体识别能力。项目引入规范化方法将检测输出转换为与MLLM兼容的文本输出,并提出新的评估方法以确保与传统检测器的公平比较。支持光学图像(如DOTA-v1.0、DIOR-R)和SAR图像(如SRSDD、RSAR),扩展了在不同数据类型上的应用潜力。