DINOv2是Meta AI开发的最先进计算机视觉模型,具有自监督学习功能,无需大量标注数据即可训练。它能够直接从图像中学习特征,适用于图像分类、分割、检索和深度估计等多种任务。DINOv2的预训练版本已上线,与CLIP和OpenCLIP等模型竞争,并在众多任务中表现出色。
B-cos Networks旨在通过对齐实现模型的可解释性,提供最先进的性能,适用于各种机器学习任务。
SegViT是一个基于纯视觉变换器的语义分割项目,旨在提高图像分割任务的效率和性能。它能够处理多种图像分割任务,适应不同的应用场景,为研究人员和开发者提供了强大的工具。
GPT4视觉用例集锦是一个集合了多种视觉任务的项目,基于最新的GPT-4模型,提供丰富的示例和用例,旨在帮助用户更好地利用视觉技术。该项目采用易于使用的API接口,支持图像分类、对象检测、图像生成和视觉问答等功能,适用于广泛的应用场景。
这是一个基于TensorPack框架的实现与模型集锦,包含多种预训练模型,适用于图像处理和计算机视觉任务,易于扩展和自定义。
SparK项目旨在通过稀疏和层次化的掩码建模,设计出适用于卷积网络的BERT模型,提升卷积网络在各种任务上的表现。