一种处理噪声标签的少样本学习方法,旨在提高模型在标签不准确情况下的学习能力。该方法利用少量标记样本进行训练,具备对标签噪声的鲁棒性,适用于图像分类等任务。
Dioptra是一个开源的数据策展和管理平台,旨在支持计算机视觉、自然语言处理和大型语言模型。它帮助用户策划有价值的未标记数据,注册元数据,诊断模型失效模式,并与标注和再训练系统整合。
CMT是一个结合卷积神经网络和视觉变换器优势的项目,旨在提升图像分类和目标检测的性能,具有广泛的应用前景。
AISP是一个基于模型的图像信号处理工具,利用可学习字典来提高图像处理的效率和效果。该项目旨在通过先进的算法和模型,优化图像信号的重建和处理,适用于各种图像处理任务。
纽约大学的研究人员提出了一种通过隐扩散模型保留不同年龄身份特征的方法,并且只需要少样本训练,即可直观地用「文本提示」来控制模型输出。
来自清华团队开源的一个 AI 项目,通过强化学习技术训练出一个 7B 模型,在数学推理能力上超越 GPT-4o 以及 Llama-3.1 70B。
VGSE是一个用于零样本学习的工具,利用视觉基础的语义嵌入技术,能够在没有标记示例的情况下进行图像分类和视觉数据的语义理解。
通过执行 OpenCLIP 模型的知识蒸馏,用零标记数据创建自定义图像分类模型。该项目利用现有的 OpenCLIP 模型,能够在没有标记数据的情况下进行图像分类,支持高效的模型训练和推理,适合各种自定义应用场景。
该项目专注于通过同心因果注意机制减轻模型中的物体幻觉问题,旨在提高模型对物体的识别能力,特别是在复杂的视觉语言任务中。
Skill-it是一个用于理解和训练大语言模型(LLM)的数据驱动技能框架,通过选择合适的训练数据来提升下游模型在不同任务上的性能。