AI交流(进群备注:Epochraft)

Epochraft是一个数据加载器库,专注于即时标记化和检查点功能,特别用于流畅训练语言模型(LLM),旨在提高数据处理的效率和训练过程的灵活性。
Epochraft的特点:
1. 即时标记化功能
2. 检查点功能
3. 支持流畅训练语言模型
4. 易于集成和使用
Epochraft的功能:
1. 加载数据并进行标记化
2. 在训练过程中保存和恢复检查点
3. 与其他深度学习框架兼容使用
4. 为基础模型训练提供实用工具
相关导航

DPO(Direct Preference Optimization,直接偏好优化)是一种离线优化方法,直接利用偏好数据训练策略,无需显式奖励模型。该项目是基于论文《Direct Preference Optimization: Your Language Model is Secretly a Reward Model》的参考实现,支持因果 HuggingFace 模型和自定义数据集,提供了一种无需显式奖励模型的离线优化方法。特别适合语言模型对齐任务,研究表明其在控制生成情感、摘要质量和单轮对话响应上表现不亚于或优于现有方法。

MiniMind 是一个开源 AI 项目,旨在从零开始,以极低的成本和极短的时间训练出超小语言模型。项目涵盖了从数据集清洗到模型训练的全过程,并提供了多种先进的算法和模型结构。通过仅需 3 块钱成本和 2 小时,即可训练出 25.8M 的超小语言模型,最小版本体积是 GPT-3 的 1/7000,适合普通个人 GPU 快速训练。项目还拓展了视觉多模态的 VLM: MiniMind-V,所有核心算法代码均从 0 使用 PyTorch 原生重构,不依赖第三方库提供的抽象接口。这不仅是大语言模型的全阶段开源复现,也是一个入门 LLM 的教程。