模型合并工具

MergeUI官网 – 全能界面，探索合并模型

MergeUI是一个直观的用户界面，旨在帮助用户探索在Hugging Face上合并的语言模型（LLMs）。通过合并模型，用户可以以低廉的成本创建强大的语言模型，无需GPU。该工具提供了有关模型合并的建议，帮助用户决定合并哪些模型以及使用什么合并策略。

Hugging FaceMergeUI性能评估模型合并工具

mergekit开源项目 – 合并多种语言模型的工具

mergekit开源项目 – 合并多种语言模型的工具

一个合并预训练大型语言模型的工具，能够将多个模型组合成一个独特的、性能更优的模型。

多语言模型微调简化性能提升模型合并工具

LLM Consortium开源项目 – 协调多个大型语言模型的系统

LLM Consortium开源项目 – 协调多个大型语言模型的系统

用于协调多个大型语言模型（LLM）的系统，通过迭代反馈和共识达成，来解决复杂问题

AI解决方案研究LLM协调系统多模型协作

CMU_MATH-AIMO开源项目 – AI数学奥林匹克竞赛的开源项目

CMU_MATH-AIMO开源项目 – AI数学奥林匹克竞赛的开源项目

卡内基梅隆大学团队在首届AI数学奥林匹克竞赛(AIMO)中获得亚军的开源项目，包含完整的训练数据集(AIME、AMC、Odyssey-Math)、验证集、模型微调代码和数据收集脚本，为研究AI解决数学问题提供了宝贵资源

AI数学竞赛开源项目数学问题解决数据集

VideoTuna开源项目 – 多功能视频生成模型工具

VideoTuna开源项目 – 多功能视频生成模型工具

VideoTuna是一个集成了多种视频生成模型的代码库，支持从文本到视频、图像到视频的生成，并提供了预训练、连续训练、对齐和微调等完整的视频生成流程。它支持多种视频生成模型，如CogVideoX、Open-Sora、VideoCrafter等，能够处理不同分辨率的生成任务。此外，VideoTuna还提供了丰富的后处理功能，如视频到视频的后处理和增强模块，并计划推出3D视频VAE和可控面部视频生成模型，进一步扩展应用场景。

AI视频生成工具图像到视频生成微调工具文本到视频生成

LLaMA-MoE开源项目 – 混合专家模型的持续预训练

LLaMA-MoE开源项目 – 混合专家模型的持续预训练

基于LLaMA和SlimPajama的MoE模型，旨在利用混合专家模型进行持续预训练。该模型结合了LLaMA和SlimPajama的优点，通过支持混合专家架构，提高模型的效率和性能，同时能够进行持续的预训练，以适应不同的任务，灵活的模型配置使其适用于多种应用场景。

LLaMA-MoE持续预训练模型微调混合专家模型

DeepSeek-V3官网 – 高效且小巧的量化模型

DeepSeek-V3 的Q4_k_m 量化版本，大小比原本的小一半，兼容性强，适用于多种环境，提升处理效率，同时保留大部分原始模型性能。

文本生成模型微调自然语言处理量化模型

Dreambooth Extension for Stable-Diffusion-WebUI开源项目 – 增强图像生成能力的强大扩展

Dreambooth Extension for Stable-Diffusion-WebUI开源项目 – 增强图像生成能力的强大扩展

这是一个强大的Stable Diffusion Web UI扩展，利用Dreambooth技术提升图像生成能力，允许用户使用个性化图像训练自定义模型，并提供易于使用的界面来管理训练参数。

DreamboothStable Diffusion图像生成扩展工具

BakLLaVA开源项目 – 多模态能力增强的语言模型

BakLLaVA开源项目 – 多模态能力增强的语言模型

将SOTA多模态能力融入语言模型，改进基础模型、修改训练过程、自定义数据集以及对LLaVA实现的重大架构更改。

多模态能力增强的语言模型模型性能优化自定义训练模型语言生成

人脸生成-通过文本提示生成不同年龄人脸

纽约大学的研究人员提出了一种通过隐扩散模型保留不同年龄身份特征的方法，并且只需要少样本训练，即可直观地用「文本提示」来控制模型输出。

人脸生成少样本训练年龄特征保留文本提示控制

Cosmos SDK开源项目 – 构建区块链应用的框架

Cosmos SDK开源项目 – 构建区块链应用的框架

Cosmos SDK 是一个用于构建区块链应用程序的框架，特别用于构建 Gaia，即 Cosmos Hub 的实现。它提供了模块化的架构和多链互操作性，旨在促进区块链的可扩展性和社区参与。

区块链应用开发框架区块链治理模块化区块链跨链通信

Argilla Cookbook开源项目 – 提供Argilla工具的简单示例

Argilla Cookbook开源项目 – 提供Argilla工具的简单示例

一个提供使用Argilla工具构建AI的简单示例的项目，主要功能包括数据标注、模型性能优化等，特色在于通过Jupyter Notebook形式提供直观的操作指导

Argilla工具Jupyter Notebook数据标注模型性能优化

One-for-All: Bridge the Gap Between Heterogeneous Architectures in Knowledge Distillation开源项目 – 跨架构知识蒸馏性能提升

One-for-All: Bridge the Gap Between Heterogeneous Architectures in Knowledge Distillation开源项目 – 跨架构知识蒸馏性能提升

该项目专注于在知识蒸馏中弥合不同架构之间的性能差距，通过有效的策略提升模型的表现。

异构架构机器学习模型性能提升知识蒸馏

GPT-Neo-2.7B Fine-Tuning Example开源项目 – 使用少量代码微调生成电影描述

GPT-Neo-2.7B Fine-Tuning Example开源项目 – 使用少量代码微调生成电影描述

该项目演示了如何使用HuggingFace和DeepSpeed对EleutherAI的GPT-Neo模型进行微调，以生成Netflix电影描述，整个过程仅需47行代码，便于实现高效的文本生成。

DeepSpeedGPT-Neo微调HuggingFace文本生成

AI-magic收录了大量国内外AI工具箱，包括AI写作、图像、视频、音频、编程等各类AI工具，以及常用的AI学习、技术、和模型等信息，让你轻松加入人工智能浪潮。

Copyright © 2025 AI-magic 浙ICP备19008543号-3