电影镜头分类器是一个利用微软Florence-2模型进行微调的计算机视觉项目,专门针对ShotDEAD-v0数据集优化,用于高效分类电影镜头类型。 该项目提供完整的训练和推理代码,支持镜头尺度(如特写、中景)和镜头运动(如推拉、摇移)等分类任务,适用于电影分析和视频内容处理领域。 由于采用Florence-2的序列到序列架构,模型在零样本和微调场景下均表现优异,但项目当前未公开URL和数据集详细信息。
基于微软Florence-2模型的电影镜头分类器,专为视频数据处理设计。该项目针对ShotDEAD-v0数据集进行了优化,提供了完整的训练和推理代码,使用户能够轻松上手并进行自定义模型微调。无论是自动化分类电影镜头,还是优化视频数据处理流程,该工具都能提供卓越的性能和精准的分类结果。