TinyCLIP通过亲和模仿和权重继承技术,优化CLIP模型的蒸馏过程,提升小型模型在视觉任务中的表现,并支持多模态应用的迁移学习。
MobileNet V1的TensorFlow官方checkpoint到PyTorch版本的checkpoint转换工具,旨在简化不同深度学习框架之间的模型迁移,同时保持模型的精度和性能,适用于研究人员和开发者。
Macaw-LLM是一项探索性的努力,它通过无缝地结合图像、视频、音频和文本数据,开创了多模态语言建模。
质衡: 通用基础模型在底层视觉上的基准测试,包含中文版【底层视觉问答】和【底层视觉描述】数据集,以及中文提示下的图片质量评价。
该论文探讨了语言模型在反事实任务中的能力和限制,揭示了它们在抽象推理方面的表现及其依赖的任务解决程序。