MiniMind开源项目 – 低成本快速训练超小语言模型

MiniMind 是一个开源 AI 项目，旨在从零开始，以极低的成本和极短的时间训练出超小语言模型。项目涵盖了从数据集清洗到模型训练的全过程，并提供了多种先进的算法和模型结构。通过仅需 3 块钱成本和 2 小时，即可训练出 25.8M 的超小语言模型，最小版本体积是 GPT-3 的 1/7000，适合普通个人 GPU 快速训练。项目还拓展了视觉多模态的 VLM: MiniMind-V，所有核心算法代码均从 0 使用 PyTorch 原生重构，不依赖第三方库提供的抽象接口。这不仅是大语言模型的全阶段开源复现，也是一个入门 LLM 的教程。

MiniMind的特点:

1. 极低成本训练：仅需 3 块钱成本 + 2小时
2. 超小模型体积：最小版本体积是 GPT-3 的 1/7000
3. 轻量级模型：最普通的个人GPU也可快速训练
4. 全阶段开源复现：包含大模型的极简结构、数据集清洗、预训练、监督微调、LoRA微调、直接偏好强化学习(DPO)算法、模型蒸馏算法等全过程代码
5. 视觉多模态拓展：MiniMind-V
6. 原生 PyTorch 重构：所有核心算法代码均从 0 使用 PyTorch 原生重构，不依赖第三方库提供的抽象接口
7. 入门教程：适合 LLM 初学者

MiniMind的功能:

1. 用于训练超小语言模型，适合资源有限的个人开发者
2. 作为大语言模型的全阶段开源复现教程，帮助初学者入门 LLM
3. 用于视觉多模态任务，如 MiniMind-V
4. 用于模型蒸馏和微调，提升模型性能
5. 用于直接偏好强化学习(DPO)算法的研究和应用

相关导航

AI GPT-4o Chat: Ask Question官网 – 革命性的AI问答应用

AI GPT-4o Chat 是一款基于GPT-4o技术的AI驱动应用，能够处理上传的图像，并根据这些图像进行有意义的对话。

百亿参数大模型进化树更新-更新了大模型的时间轴和应用技巧

本次报告更新了近年来超过100亿参数的时间轴，把时间轴从原来的和更新到了和。并进一步提供了26个有用的LLM提示技巧和如何解决多种常见任务的具体示例。

lmms-finetune开源项目 – 多模态大模型微调工具

lmms-finetune 是一个多模态大模型微调工具，提供了一个统一的代码库，简化了微调流程，支持微调多种LLM。它支持完整模型微调和LoRA微调两种方式，并且具有良好的扩展性，能够满足不同场景下的需求。

OpenBiomechanics开源项目 – 开源棒球投手动作捕捉数据

OpenBiomechanics是一个开源项目，提供高质量的棒球投手动作捕捉数据，旨在促进运动科学和生物力学研究。该项目支持数据的可视化与分析，用户可以根据需要进行定制和扩展。

dhSegment开源项目 – 深度学习文档分割工具

dhSegment是一个通用的深度学习框架，专门用于文档分割，尤其适用于历史文档处理。它能够从不同类型的文档中提取内容（如文本区域、图像等），并支持复杂的文档布局分析。该项目是开源的，可在GitHub上获取，广泛应用于数字保存、文档内容提取和OCR预处理等领域。

OSX-KVM开源项目 – 在 QEMU/KVM 上运行 macOS

OSX-KVM 是一个开源项目，允许用户在 QEMU/KVM 虚拟化环境中运行各种版本的 macOS，提供高性能和易于配置的解决方案。

D8VK开源项目 – Direct3D 8 转 Vulkan 的转换层

D8VK 是 DXVK 的 Direct3D 8 实现，提供了一个基于 Vulkan 的转换层，用于将 Direct3D 8 调用转换为 Vulkan API。该项目旨在支持在非 Windows 平台上运行 Direct3D 8 应用程序，并提供更好的图形性能和稳定性。D8VK 继承了 DXVK 的高效性和兼容性，是一个开源项目，允许社区贡献和改进。

Open-Assistant开源项目 – 让每个人都能访问聊天模型

一个旨在让每个人都能访问基于聊天的大型语言模型的项目，可以看作是ChatGPT的替代品。

Maestro开源项目 – 加速多模态模型微调的工具

一个专为加速多模态模型（如 PaliGemma、Florence-2 和 Qwen2-VL）微调的工具，简化配置、数据加载、重现性和训练循环的设置。

可解释机器学习系列公开课开源项目 – 深入了解人工智能可解释性分析

该课程包含人工智能可解释性分析领域的导论、算法综述、经典论文精读、代码实战和前沿讲座，由B站知名UP主“同济子豪兄”主讲，课程视频免费开源。

MuKoe开源项目 – 开源 MuZero 实现，支持分布式计算

MuKoe 是一个完全开源的 MuZero 算法实现，利用 Ray 作为分布式调度器，并在 Google Kubernetes Engine (GKE) 上运行。该项目旨在为研究人员和开发者提供一个高效的平台，用于研究和开发 MuZero 算法，同时支持在分布式环境中进行大规模实验。

MME-CoT开源项目 – 多模态大模型推理能力评估基准

MME-CoT是一个为多模态大模型提供全面推理能力评估的基准测试工具。它覆盖了数学、科学、OCR等六大领域，通过提出三项新指标，深度剖析模型的推理质量、鲁棒性和效率，揭示模型在视觉推理任务中的表现，从而助力多模态模型的发展。

Inductive Moment Matching (IMM)开源 – 高效稳定的图像生成模型

Inductive Moment Matching (IMM) 是一种新型生成模型，能够在单阶段从零开始训练，实现高效且稳定的样本生成。它利用随机插值器和时间相关的边缘分布，学习一个单步采样器，将分布从时间 t 转换到 s < t。通过最小化不同起始时间导出的时间 s 分布之间的最大平均差异 (MMD)，IMM 保证分布级别的收敛性。在图像生成任务上，IMM 取得了最先进的性能，例如在 ImageNet-256x256 上仅需 8 步推理，FID 达到 1.99。

Epochraft开源项目 – 专注即时标记化和检查点功能的库

Epochraft是一个数据加载器库，专注于即时标记化和检查点功能，特别用于流畅训练语言模型(LLM)，旨在提高数据处理的效率和训练过程的灵活性。

Cline MCP Marketplace开源项目 – 简化MCP服务器发现与安装

Cline MCP Marketplace是一个专为开发者设计的平台，旨在简化MCP服务器的发现和安装过程。通过该平台，开发者可以轻松找到并安装所需的MCP服务器，同时社区成员也能提交自己的资源，丰富平台内容。此外，平台与Cline深度集成，帮助AI工具快速接入MCP服务器，提升开发效率。

personal-ai开源项目 – 本地化个人AI助手

Personal AI 是一个利用 Apple Shortcuts、Cloudflare Workers 和 Llama 3 组装的本地 AI 助手，无需额外硬件或月费。它通过 Apple Shortcuts 提供 ASR、TTS 和 HTTP 请求功能，并通过 Cloudflare Workers 处理文本和函数调用。该助手支持与 Llama 3 的集成，比所有 AI 可穿戴设备更快，并且可扩展以支持更复杂的函数调用和内存管理。

llms-deep-dive-tutorials开源项目 – 大语言模型深入教程

《深入大语言模型》随书代码，配套书籍 'Large Language Models: A Deep Dive'。该项目提供了大语言模型的深入教程和示例代码，涵盖多种应用场景，包含详细的代码注释和解释，支持多种编程语言和框架，并提供实际案例和项目实践。

暂无评论

暂无评论...