gan-manifold-reg是一个结合生成对抗网络(GANs)和流形正则化(Manifold Regularization)技术的半监督学习项目。它旨在通过GANs生成额外的训练数据,并利用流形正则化技术提高模型在半监督学习任务中的性能。该项目基于PyTorch实现,支持自定义数据集和模型架构,适用于图像分类等半监督学习任务,尤其在医学图像分析等需要大量标注数据的领域中表现出色。
该项目专注于自监督学习在视频对象分割中的应用,由复旦大学、牛津大学和西弗吉尼亚大学的研究人员共同开发。旨在通过自监督学习技术,结合半监督学习方法,提高视频对象分割的准确性,特别是在标注数据有限的情况下,能够在复杂视频场景中实现高质量的分割。项目开源,并在GitHub上提供,供社区使用和贡献。
TabularS3L是一个基于PyTorch Lightning的库,专门用于表格数据的自监督和半监督学习。它提供了一个统一的框架,使用户能够轻松探索和部署相关模型,适用于各种表格数据处理任务。
kaggle_salt_bes_phalanx 是一个专注于地震图像中盐体分割的项目,采用卷积神经网络(CNN)集成方法,结合半监督学习技术,旨在提高分割精度。该项目特别适用于地质分析、油气勘探等领域,能够有效识别地震图像中的盐体。项目开源,代码可在GitHub上获取,适合研究、开发和教育用途。
该项目提供了一种视频语义分割的方法,利用帧间特征重建技术,在半监督学习的框架下提升模型性能,适用于缺乏标注数据的场景。
FlowSAM是一个用于视频中的运动对象分割的项目,结合了Segment Anything模型(SAM)和光流技术,旨在提高分割精度和效率。它不仅能够处理单一对象,还能在多对象场景中保持对象身份,提升分割性能。
GIMM-VFI是一种新的视频插值方法,它使用运动建模来预测帧之间的运动。该方法通过有效建模真实世界视频中的时空动态,能够生成更高质量的运动视频,并且可以与现有的基于流的VFI工作集成。
这是一个双层递归卷积网络模型的参考实现,旨在提供灵活的应用支持和优化的性能。
包含真实场景级视频和场景标注的大型数据集,具有10,510个多视角场景,51.2百万帧,分辨率为4k,还包括140个用于新视角合成(NVS)的基准视频以及来自SOTA NVS方法的训练参数,为深度学习的3D视觉任务提供了丰富的场景和标注信息