AGVM是一个用于密集视觉预测的大批量优化项目,旨在提高深度学习模型在视觉任务中的训练和优化效率。
一种用于视觉-语言预训练的多模态数据集,通过将图像和文本交错排列,提供丰富的基础知识,帮助模型更好地理解和生成多模态内容
SyntheticAIdata是一个帮助企业生成高质量合成数据的平台,专为训练视觉AI模型而设计。它提供了一种成本效益高的合成数据获取解决方案,支持图像分类、分割和物体检测等多种计算机视觉任务。该平台得到了Microsoft for Startups的支持,并且是NVIDIA Inception项目的一部分。
Dual-Radar 是一个专为无人驾驶技术开发的高质量双雷达数据集,旨在为深度学习模型提供真实场景下的目标检测与跟踪数据。该数据集涵盖多种无人驾驶场景,包含丰富的目标检测与跟踪标签,能够有效支持无人驾驶系统的训练与验证。
该项目展示了如何利用扩散模型生成高性能的神经网络参数。通过自动编码器提取潜在表示,并训练扩散模型从随机噪声合成这些表示,从而生成新的网络参数子集。
VL-PET是通过粒度控制实现视觉与语言模型的参数高效调优,旨在提升模型在特定任务上的表现。
fullmoon-ios是一个开源的iOS本地LLM项目,支持与本地大模型进行聊天,兼容iPhone、iPad、Mac和Vision设备,旨在提供用户隐私保护的同时,方便用户进行多种文本生成和对话交互。