一种利用自我学习原则的度量学习方法,无需标签。
DINOv2是Meta AI开发的最先进计算机视觉模型,具有自监督学习功能,无需大量标注数据即可训练。它能够直接从图像中学习特征,适用于图像分类、分割、检索和深度估计等多种任务。DINOv2的预训练版本已上线,与CLIP和OpenCLIP等模型竞争,并在众多任务中表现出色。
SPARC是一种用于从图像-文本对中预训练更精细的多模态表示的方法,通过在描述中的每个token上学习图像块的分组来实现。
Residual Attention是一种简单但有效的多标签识别方法,利用残差注意机制,能够在多标签任务中表现出色。
该网络旨在利用跨模态知识蒸馏技术进行单目3D目标检测,以提高目标检测任务的准确性。
Pinecone 是一个先进的向量数据库,旨在高效且低成本地为 AI 应用提供支持。作为无服务器解决方案,它能够快速部署和扩展 AI 服务,处理数十亿个向量嵌入,提供低延迟搜索能力,适用于推荐系统、搜索引擎等 AI 驱动的应用。
Salient Extract是一个基于yoloV8深度学习模型的显著目标提取工具,能够高效提取图像中的显著特征,支持多种输入图像格式,并能与其他计算机视觉任务结合使用。
FocalClick是一个旨在实现实际交互式图像分割的项目,能够在真实场景中应用,为用户提供高效的图像对象分割功能。
GS-LoRA项目致力于为预训练视觉模型提供持续学习的能力,减少灾难性遗忘的问题,从而在新任务上有效微调模型,提高模型在顺序学习任务中的表现。