Rerun 是一个用于记录计算机视觉和机器人数据的 SDK,并配有可视化工具,可以随时间探索这些数据。它允许用户以最小的代码调试和理解系统的内部状态和数据。开发者可以将数据记录到 Rerun SDK,系统会自动进行可视化处理。Rerun 支持来自多个进程的实时数据流,并可回放录制的数据。Rerun Viewer 根据记录的数据创建可配置的可视化效果,用户可以随时回溯和前进时间。
Scenic是一个基于JAX的计算机视觉研究库,支持多种计算机视觉任务,利用JAX的高性能特点,提供灵活和模块化的架构。
Anyscale是一个统一的计算平台,旨在利用Ray简化可扩展AI和Python应用的开发、部署和管理。用户可以轻松地开始使用Anyscale端点进行服务和微调开源大型语言模型(LLMs)。
Undress AI Pro是一个基于计算机视觉的应用程序,通过机器学习技术将人像中的衣物去除,生成合成裸露图像。用户只需上传照片,即可在几分钟内获得处理结果。该项目在技术上具有争议性,同时也为探索计算机视觉技术提供了新的视角。
ID-Blau是一个基于隐式扩散的方法,用于图像去模糊,通过重模糊增强技术来提升图像质量,适用于计算机视觉任务。
GeneOH Diffusion旨在通过去噪扩散技术实现通用的手物交互去噪,提升图像质量。
《机器人学、视觉与控制(第三版)》的Python代码实例库,提供第三版教科书中的算法实现,助力机器人与计算机视觉领域的学习和研究。该项目包含多种与机器人学和计算机视觉相关的算法实现,适合用于教学和实践相结合的学习方式。
分享 GitHub 上一份开源免费的在线教程,涵盖了 PyTorch 基础知识、神经网络、计算机视觉、自定义数据集处理、模块化代码编写以及模型部署等内容。
3PSDF是一个用于学习任意拓扑表面的签名距离函数的项目,采用三极点方法,能够高效地重建复杂表面。
OakInk是一个专注于手物交互的大规模知识库,旨在促进对手与物体之间互动的理解。它支持多种手物交互任务,为研究人员和开发者提供丰富的资源和工具。
RT-DETR(Real-time DEtection Transformer)是一种在速度和准确率方面均超越YOLO系列的先进物体检测模型,旨在提升计算机视觉任务的效率和效果。该模型采用高效的混合编码器和不确定性最小查询选择方法,支持灵活的速度调整和多尺度特征处理,在COCO数据集上表现出色。
Glue Factory是CVG开发的一个库,用于训练和评估深度神经网络,专注于提取和匹配局部视觉特征。
CMT是一个结合卷积神经网络和视觉变换器优势的项目,旨在提升图像分类和目标检测的性能,具有广泛的应用前景。
Manot 是一个专注于计算机视觉模型性能的洞察管理平台,能够准确识别模型的失效原因,助力快速优化和重新部署,显著提升模型的准确性和降低成本。
Living Images是一个图像优化工具,利用生成式A/B测试技术,用户只需输入网站,选择需要改进的图像,然后添加相应的脚本或图像URL即可。该工具旨在提高网站的转换率和图像加载速度。
Wachy是一个用于Linux的动态追踪性能分析器,支持多种追踪工具和框架,能够实时监控系统性能,并提供用户友好的界面以可视化追踪数据,允许用户根据特定应用程序自定义分析选项。
Taichi是一种嵌入在Python中的领域特定语言,旨在加速Python代码执行,使其运行速度接近C++甚至CUDA,提供高性能的计算能力,同时保持Python的灵活性和简洁性。它支持多种硬件平台,包括CPU和GPU,并内置自动微分功能,具有强大的并行计算能力,适合各类高性能计算任务。
VIGC(Visual Instruction Generation and Correction)是一个用于生成和修正视觉指令的项目,旨在提高视觉任务的效率和准确性,适用于多种视觉任务。