Residual Attention是一种简单但有效的多标签识别方法,利用残差注意机制,能够在多标签任务中表现出色。
CMT是一个结合卷积神经网络和视觉变换器优势的项目,旨在提升图像分类和目标检测的性能,具有广泛的应用前景。
SPARC是一种用于从图像-文本对中预训练更精细的多模态表示的方法,通过在描述中的每个token上学习图像块的分组来实现。
PatchDCT是用于高质量实例分割的补丁细化技术,旨在提高图像分割的精度和效果。该项目利用补丁细化方法,增强了实例分割的性能,适用于多种图像处理任务。
Lobe 是一款免费且易于使用的应用程序,用户可以训练自定义机器学习模型并将其融入自己的应用中。它提供了可视化编程界面,支持多种任务,如图像分类、目标检测和数据分类。用户只需下载应用,收集并标记图像或数据,Lobe 会基于标记的示例自动训练模型,用户可以使用摄像头或图像来测试模型,并在改进预测后将其导出到应用中进行部署。
ARRTIFICIAL是一个强大的人工智能平台,利用先进的机器学习和深度学习算法,实现数据分析和预测建模的自动化。用户只需上传数据,选择所需的算法和参数,平台便可自动分析和建模。
DE-DETRs旨在实现数据高效的目标检测,采用Transformer架构,适用于需要减少数据使用的场景。
FocalClick是一个旨在实现实际交互式图像分割的项目,能够在真实场景中应用,为用户提供高效的图像对象分割功能。
第一个无自然语言的纯视觉大模型,证明了纯视觉模型本身也是可扩展的。该模型支持多种数据形式,通过上下文学习来理解并执行下游任务,具有很强的可扩展性。
这个项目能分析图像中对象之间的关系,是一个将Meta的Segment-Anything模型与ECCV'22论文相结合的演示:Panoptic Scene Graph Generation。