OpenBiomechanics是一个开源项目,提供高质量的棒球投手动作捕捉数据,旨在促进运动科学和生物力学研究。该项目支持数据的可视化与分析,用户可以根据需要进行定制和扩展。
《人体运动扩散模型》的论文代码,旨在高效生成和编辑人体运动,支持多种运动风格和动作捕捉数据。
Move AI是一种创新的运动捕捉技术,通过将2D视频转化为3D运动数据,利用先进的AI、计算机视觉、生物力学和物理学,简化了动画角色的运动捕捉过程,适用于从独立创作者到大型工作室的广泛用户。
LLMChat是一个全栈Web界面的实现,支持多种大型语言模型,如ChatGPT或LLaMA,旨在提供用户友好的互动体验。它允许用户进行实时对话,并具备可定制的模型参数,方便多种部署选项。
ModelScope魔搭开源的ClearerVoice-Studio项目,提供语音增强、语音分离、目标说话人提取等功能,旨在提升语音处理的质量和效率。
LaMini-LM是一个对多个迷你大语言模型进行微调的项目,旨在提升模型的性能,其中包括经过微调的GPT-2,其性能可与LLaMa的Alpaca-7B相媲美。
这是一个强大的Stable Diffusion Web UI扩展,利用Dreambooth技术提升图像生成能力,允许用户使用个性化图像训练自定义模型,并提供易于使用的界面来管理训练参数。
QA-CLIP是一个支持中文文本和图像的多模态理解的模型,具有最先进的性能和准确性,能够用于多种下游任务,如图像分类、文本生成等,且易于集成和使用。
stablediffusion api是一个强大的API,旨在让开发者专注于构建下一代AI产品,而无需担心GPU的维护。它提供了便捷的接口,支持用户生成和微调Dreambooth Stable Diffusion,极大地简化了图像生成的流程和技术门槛。
BGE-M3-Model-Converter是一个专门用于手动转换BGE-M3模型的工具,能够有效保留训练变量,并且用户可以直接控制模型的输出,从而满足不同应用场景的需求。
建立在HuggingFace模型和PyTorch Fully Sharded Data Parallelism基础上的训练套件,旨在优化吞吐量,简化在资源受限环境中训练中型模型的分布式方案设置工作流程,尤其适用于学术集群。
NeuralClothSim结合了神经变形场和薄壳理论,实现了高效的服装模拟,能够生成逼真的服装动态效果,适用于动画、游戏和虚拟现实等多个领域。
LOMO是复旦大学提出的新论文,旨在使用单台8片24G的RTX 3090对Llama 65B模型进行全参数微调。该项目通过优化训练效率和性能,为用户提供了兼容多种深度学习框架的解决方案,并附带详细的实验结果和分析,帮助用户更好地理解模型的表现。
利用Stable Diffusion算法和ControlNet合成航拍图像,数据集源自IGN的FLAIR(法国航空图像地面覆盖数据),用于法国各地区的地面覆盖信息。该项目结合了先进的图像生成技术,能够处理高分辨率图像,提供准确的数据支持。
2000 Fine Tuning Prompts是一个全面的资源,旨在帮助爱好者学习和实验微调,熟悉其在不同上下文中的功能和应用。
TCAN是一种基于扩散模型的新型人体图像动画框架,能够保持时间一致性并良好地推广到未知领域。它使用预先训练的ControlNet,增强了对姿势检测器异常值的稳健性,适用于多种姿势的视频合成任务。