MergeUI是一个直观的用户界面,旨在帮助用户探索在Hugging Face上合并的语言模型(LLMs)。通过合并模型,用户可以以低廉的成本创建强大的语言模型,无需GPU。该工具提供了有关模型合并的建议,帮助用户决定合并哪些模型以及使用什么合并策略。
一个合并预训练大型语言模型的工具,能够将多个模型组合成一个独特的、性能更优的模型。
用于协调多个大型语言模型(LLM)的系统,通过迭代反馈和共识达成,来解决复杂问题
卡内基梅隆大学团队在首届AI数学奥林匹克竞赛(AIMO)中获得亚军的开源项目,包含完整的训练数据集(AIME、AMC、Odyssey-Math)、验证集、模型微调代码和数据收集脚本,为研究AI解决数学问题提供了宝贵资源
VideoTuna是一个集成了多种视频生成模型的代码库,支持从文本到视频、图像到视频的生成,并提供了预训练、连续训练、对齐和微调等完整的视频生成流程。它支持多种视频生成模型,如CogVideoX、Open-Sora、VideoCrafter等,能够处理不同分辨率的生成任务。此外,VideoTuna还提供了丰富的后处理功能,如视频到视频的后处理和增强模块,并计划推出3D视频VAE和可控面部视频生成模型,进一步扩展应用场景。
基于LLaMA和SlimPajama的MoE模型,旨在利用混合专家模型进行持续预训练。该模型结合了LLaMA和SlimPajama的优点,通过支持混合专家架构,提高模型的效率和性能,同时能够进行持续的预训练,以适应不同的任务,灵活的模型配置使其适用于多种应用场景。
DeepSeek-V3 的Q4_k_m 量化版本,大小比原本的小一半,兼容性强,适用于多种环境,提升处理效率,同时保留大部分原始模型性能。
这是一个强大的Stable Diffusion Web UI扩展,利用Dreambooth技术提升图像生成能力,允许用户使用个性化图像训练自定义模型,并提供易于使用的界面来管理训练参数。
将SOTA多模态能力融入语言模型,改进基础模型、修改训练过程、自定义数据集以及对LLaVA实现的重大架构更改。
纽约大学的研究人员提出了一种通过隐扩散模型保留不同年龄身份特征的方法,并且只需要少样本训练,即可直观地用「文本提示」来控制模型输出。
Cosmos SDK 是一个用于构建区块链应用程序的框架,特别用于构建 Gaia,即 Cosmos Hub 的实现。它提供了模块化的架构和多链互操作性,旨在促进区块链的可扩展性和社区参与。
一个提供使用Argilla工具构建AI的简单示例的项目,主要功能包括数据标注、模型性能优化等,特色在于通过Jupyter Notebook形式提供直观的操作指导
该项目专注于在知识蒸馏中弥合不同架构之间的性能差距,通过有效的策略提升模型的表现。
该项目演示了如何使用HuggingFace和DeepSpeed对EleutherAI的GPT-Neo模型进行微调,以生成Netflix电影描述,整个过程仅需47行代码,便于实现高效的文本生成。