实验性研究支持

Helibrunna开源项目 – 提升xLSTM训练效率的框架

Helibrunna开源项目 – 提升xLSTM训练效率的框架

Helibrunna是一个兼容Hugging Face的xLSTM训练框架，旨在探索xLSTM在AI领域的潜力，提升模型训练效率并支持实验性研究。

Hugging Face兼容xLSTM训练框架实验性研究支持模型训练效率提升

Helibrunna开源项目 – 提升xLSTM训练效率的框架

Helibrunna开源项目 – 提升xLSTM训练效率的框架

Helibrunna是一个兼容Hugging Face的xLSTM训练框架，旨在探索xLSTM在AI领域的潜力，提升模型训练效率并支持实验性研究。

Hugging Face兼容xLSTM训练框架实验性研究支持模型训练效率提升

tf-to-torch开源项目 – TensorFlow到PyTorch的模型转换工具

tf-to-torch开源项目 – TensorFlow到PyTorch的模型转换工具

MobileNet V1的TensorFlow官方checkpoint到PyTorch版本的checkpoint转换工具，旨在简化不同深度学习框架之间的模型迁移，同时保持模型的精度和性能，适用于研究人员和开发者。

MobileNet V1模型转换TensorFlow到PyTorch模型转换工具深度学习框架模型迁移

LLaMA-MoE开源项目 – 混合专家模型的持续预训练

LLaMA-MoE开源项目 – 混合专家模型的持续预训练

基于LLaMA和SlimPajama的MoE模型，旨在利用混合专家模型进行持续预训练。该模型结合了LLaMA和SlimPajama的优点，通过支持混合专家架构，提高模型的效率和性能，同时能够进行持续的预训练，以适应不同的任务，灵活的模型配置使其适用于多种应用场景。

LLaMA-MoE持续预训练模型微调混合专家模型

Picotron开源项目 – 教育目的的分布式训练框架

Picotron开源项目 – 教育目的的分布式训练框架

最小化的分布式训练框架，专为教育目的设计，让你轻松学习并实验预训练Llama类模型

Llama模型实验分布式训练框架教育目的的AI工具

Minigpt4Qwen开源项目 – 高效的自然语言处理模型

Minigpt4Qwen开源项目 – 高效的自然语言处理模型

在MiniGPT4的基础上对齐了Qwen-Chat语言模型，使用高质量的指令微调数据，通过单阶段预训练达到了很好的效果。

多语言指令执行对话生成微调基础自然语言处理模型

IEPile开源项目 – 大规模信息提取语料库

IEPile开源项目 – 大规模信息提取语料库

IEPile是一个用于训练和评估信息提取模型的大规模信息提取语料库，提供高质量的标注数据，支持多种信息提取任务，适用于学术研究和工业应用。

信息提取数据集信息提取模型训练学术研究工业应用

ChatGLM_multi_gpu_zero_Tuning开源项目 – 高效多卡微调大模型的工具

ChatGLM_multi_gpu_zero_Tuning开源项目 – 高效多卡微调大模型的工具

ChatGLM_multi_gpu_zero_Tuning是一个结合deepspeed和trainer的框架，旨在高效实现多卡微调大模型，目前支持LoRA、Ptuning-v2和Freeze三种微调方式，能够充分利用多卡资源，简化微调流程，适用于研究和开发.

deepspeed集成FreezeLoRAPtuning-v2

AI-magic收录了大量国内外AI工具箱，包括AI写作、图像、视频、音频、编程等各类AI工具，以及常用的AI学习、技术、和模型等信息，让你轻松加入人工智能浪潮。

Copyright © 2025 AI-magic 浙ICP备19008543号-3