fairseq-image-captioning是一个基于Transformer架构的图像自动描述扩展,专为PyTorch/Fairseq框架设计。它支持高效的图像特征提取与文本生成,提供了预训练模型和训练脚本,同时支持用户使用自定义数据集进行训练。该项目可以轻松集成到现有的PyTorch/Fairseq项目中,用于生成图像描述、训练新模型以及进行模型的微调和优化。