预训练模型微调

Efficient Large LM Trainer开源项目 – 大语言模型的高效训练

Efficient Large LM Trainer开源项目 – 大语言模型的高效训练

Efficient Large LM Trainer 是一款专为大规模语言模型设计的高效训练工具，旨在通过优化的算法和资源管理，提升训练速度并减少内存占用，支持多种硬件设备，便于用户集成和使用。

分布式训练大语言模型训练工具资源管理预训练模型微调

Finetune-ChatGLM2-6B开源项目 – 高效微调支持多轮对话

Finetune-ChatGLM2-6B开源项目 – 高效微调支持多轮对话

ChatGLM2-6B 全参数微调，支持多轮对话的高效微调，旨在提升对话系统的性能和用户体验。该项目通过对预训练模型的全面微调，使其能够适应特定任务和领域，提高了模型的灵活性和适用性。

全参数微调多轮对话对话系统用户交互个性化

Trapper开源项目 – 简化Transformer模型的训练与应用

Trapper开源项目 – 简化Transformer模型的训练与应用

Trapper是一个旨在更轻松地在下游任务上训练基于Transformer的模型的NLP库，采用模块化设计，提供一致的API，支持多种下游任务，能够实现最先进的NLP性能。

NLP库Transformer模型训练模块化设计模型评估与推理

transformer_from_scratch开源项目 – 深入浅出Transformer架构与PyTorch实现

transformer_from_scratch开源项目 – 深入浅出Transformer架构与PyTorch实现

该项目深入介绍了Transformer模型的背景、关键组件及其实现细节，旨在帮助开发者理解并实现Transformer架构。

PyTorch实现Transformer模型实现多头注意力数据预处理

The Interactive Transformer开源项目 – 可视化理解Transformer的工具

The Interactive Transformer开源项目 – 可视化理解Transformer的工具

The Interactive Transformer是一个可视化界面，旨在帮助用户理解和解释Transformer模型。该工具提供了交互式的可视化功能，使用户能够实时操作模型参数，并支持多种Transformer模型，具有直观的用户界面和详细的模型组件及机制解释，是学习和研究Transformer的重要工具。

Transformer教学工具交互式模型理解可视化Transformer工具

The Hugging Face Course开源项目 – Hugging Face生态使用教程

The Hugging Face Course开源项目 – Hugging Face生态使用教程

Hugging Face生态(Transformers, Datasets, Tokenizers, and Accelerate等)使用教程，旨在帮助用户掌握各种工具和库，提供实践示例和交互式学习体验，适合不同水平的开发者。

Hugging Face生态教程Transformers库使用数据集管理文本标记化

MinT开源项目 – 从头实现的最小化Transformer库

MinT开源项目 – 从头实现的最小化Transformer库

MinT 是一个轻量级、可扩展的Transformer库，专为自然语言处理任务而设计，提供易于使用的API，支持多种预训练模型，能够高效地进行模型训练和推理。

API模型训练自然语言处理轻量级Transformer库

Jax GPT开源项目 – 高效的Jax/Flax GPT模型

Jax GPT开源项目 – 高效的Jax/Flax GPT模型

Jax GPT是对Karpathy的nanoGPT的重写，基于Jax和Flax框架构建，旨在提供高效的文本生成能力，支持快速训练和推理，具有易于扩展和修改的架构，能够充分利用高性能的并行计算。

Jax GPT并行计算深度学习模型自然语言处理

MLOps for Vision Models (TensorFlow) from Transformers开源项目 – 构建视觉模型的机器学习管道

MLOps for Vision Models (TensorFlow) from Transformers开源项目 – 构建视觉模型的机器学习管道

展示如何使用 TensorFlow 生态系统从 Transformers 构建视觉模型的机器学习管道，支持完整的 MLOps 流程，集成模型管理和监控功能。

MLOpsTensorFlowTransformers机器学习管道

Skill-it-数据驱动的LLM技能框架

Skill-it是一个用于理解和训练大语言模型（LLM）的数据驱动技能框架，通过选择合适的训练数据来提升下游模型在不同任务上的性能。

在线数据采样算法持续预训练与微调提升模型性能数据驱动的LLM技能框架

AI-magic收录了大量国内外AI工具箱，包括AI写作、图像、视频、音频、编程等各类AI工具，以及常用的AI学习、技术、和模型等信息，让你轻松加入人工智能浪潮。

Copyright © 2025 AI-magic 浙ICP备19008543号-3