电影镜头分类器是一个利用微软Florence-2模型进行微调的计算机视觉项目,专门针对ShotDEAD-v0数据集优化,用于高效分类电影镜头类型。 该项目提供完整的训练和推理代码,支持镜头尺度(如特写、中景)和镜头运动(如推拉、摇移)等分类任务,适用于电影分析和视频内容处理领域。 由于采用Florence-2的序列到序列架构,模型在零样本和微调场景下均表现优异,但项目当前未公开URL和数据集详细信息。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型