Sapiens 是由 Meta 开发的一种新型人类视觉模型,旨在通过深度学习技术模拟人类视觉感知。它基于大量图像数据和高级算法,支持 1K 高分辨率推理,适合多种人类相关的视觉任务。该项目在二维姿态估计、身体部位分割、深度估计和表面法向量预测等任务上表现出色,尤其在野外数据上的泛化能力显著。Sapiens 通过预训练于超过 3 亿张野外人类图像,展示了卓越的性能,并通过简单微调适应各种任务。
Ultralytics YOLO 是一款基于 YOLO 系列的尖端对象检测和追踪模型,集成了计算机视觉和深度学习的最新进展。它继承了前代 YOLO 版本的成功,并引入了新的架构和训练流程,提升了实时推理速度、准确性和泛化能力。该模型适用于广泛的任务,包括对象检测、实例分割、图像分类和姿态估计。YOLO11 经过 COCO、ImageNet 和 DOTAv1 等大型数据集的训练,提供了卓越的准确度和速度。
Recognito Face Mobile SDK是一款用于移动设备的人脸识别软件开发工具包,提供先进的人脸识别、活体检测和姿态估计功能,支持实时处理和离线使用。
MoveNet是一个基于深度学习的高效姿态检测模型,能够在PyTorch环境中实时估计人体姿态,支持多种输入格式,并能在多个设备上运行,包括移动设备。
AiRunner是一款基于人工智能的跑步应用,提供个性化和虚拟教练服务,心率监测以及实时AI反馈。它旨在通过提供结构化的训练计划、指导跑步的姿势和技巧,以及详细的性能指标来优化跑步表现。
Forma是一个基于AI和专业教练的在线平台,用户可以上传跑步视频,获取免费的专业跑步姿势反馈,帮助改善跑步表现和减少受伤风险。
Flove是一款遵循Material You设计语言的极简运动追踪软件,用户可以通过该应用方便地记录和管理自己的运动数据,提升运动体验。
webrtc-streamer是一个WebRTC流媒体服务器,允许通过WebRTC从各种源进行视频和音频流传输。它支持RTSP、RTMP等多种流媒体协议,可与多个流媒体服务器(如Janus Gateway、SRS和ZLMediaKit)配合使用,具备低延迟流媒体能力,易于与Web应用集成,实现实时通信,并支持TURN服务器以便进行NAT穿越。
这个项目能分析图像中对象之间的关系,是一个将Meta的Segment-Anything模型与ECCV'22论文相结合的演示:Panoptic Scene Graph Generation。
Yogger是一款移动视频分析与AI运动工具,旨在帮助教练、运动员和运动爱好者轻松分析生物力学,提升表现。用户可以通过应用程序拍摄视频、收集有意义的数据、设定目标并跟踪进展。
Kayyo是一款创新的平台,利用人工智能分析用户的运动表现,并提供个性化的反馈和建议,以提升训练效果。用户只需注册账户,输入自己的目标和能力,即可获得定制的训练计划和练习,详细的视频演示和指导将帮助用户完成每项练习。
SynthMoCap是一个无需标记的全息动作捕捉项目,提供合成数据集,支持身体、面部和手部数据,适用于动作捕捉研究,结合了最新的计算机图形学技术。
TorchScale 包含我们在Transformers稳定性(DeepNet)、通用性(Magneto/Foundation Transformers)和效率性(X-MoE)的一系列研究的官方实现。我们希望通过基础本质的研究探索AI(尤其是大模型)的通用结构,并在NLP,CV,Speech和多模态等领域的任务和基础模型中广泛验证,欢迎大家使用、交流、合作开发。
Stable Diffusion是一个用于生成高质量图像的深度学习模型,经过1.5版本更新,具有更好的性能和功能。
Woodpecker是一种用于多模态大语言模型的幻觉修正工具,旨在提高生成文本的准确性和可靠性。它支持多种输入类型和数据源,集成简单,易于使用,能够有效地纠正生成过程中出现的错误信息。
Smol Vision是一个专注于视觉模型的压缩、优化与定制的方案集,旨在缩小模型尺寸、提高运行速度,并实现个性化定制。该项目支持多种视觉任务,并易于集成与使用,适合在资源有限的环境中应用。
这是一个专为健身和物理治疗应用设计的高质量视觉数据集,包含多样化的数据样本,支持机器学习和计算机视觉研究。
使用加速的极大极小化方法进行非刚性配准,具有抵抗噪声和伪影的能力。