mini_qwen开源项目 – 1B参数中英文大语言模型

mini_qwen是一个从头开始训练的1B参数的大型语言模型(LLM)项目，包括预训练(PT)、微调(SFT)和直接偏好优化(DPO)3个部分。该项目基于Qwen2.5-0.5B-Instruct模型，通过扩充模型隐藏状态层数、隐藏状态维度和注意力头数，增加参数量到1B，并进行参数随机初始化。支持中英文，预训练和微调仅需要12G显存，直接偏好优化仅需要14G显存。使用flash_attention_2进行加速，使用deepspeed在6张H800上进行训练，探究了尺度定律(scaling law)、复读机现象与微调阶段的知识注入。

mini_qwen的特点:

1. 1B参数，支持中英文，满足多样化需求
2. 预训练、微调、直接偏好优化三步走，训练流程清晰
3. 只需12G显存，就能在T4显卡上开启训练之旅
4. 详细教程与代码，新手也能轻松上手
5. 使用flash_attention_2进行加速
6. 使用deepspeed在6张H800上进行训练
7. 探究了尺度定律、复读机现象与微调阶段的知识注入

mini_qwen的功能:

1. 从零开始打造你的专属大语言模型
2. 在T4显卡上进行训练
3. 支持中英文的多样化需求
4. 通过预训练、微调、直接偏好优化三步走流程进行模型训练
5. 使用T4显卡进行预训练
6. 使用T4显卡进行微调
7. 使用T4显卡进行直接偏好优化
8. 详细记录整个训练过程，供学习和交流
9. 支持在6张H800上进行高效训练

相关导航

DocString-Generator开源项目 – 智能代码注释生成工具

DocString-Generator是一款自动生成代码注释的AI工具，能够根据代码上下文智能生成准确、简洁的注释。它支持多种编程语言，如Python、Java、C++等，能够解析函数、类、方法等代码结构，自动补全文档字符串，帮助开发者更快速地理解和维护代码。

mcp-go开源项目 – LLM应用与外部集成的Go实现

mcp-go是Model Context Protocol (MCP)的Go语言实现，旨在为LLM（大型语言模型）应用与外部数据源和工具的无缝集成提供强大支持。通过简化服务器管理和减少代码量，mcp-go帮助开发者快速构建高效的LLM应用。

Megatron-LM开源项目 – 高效训练大规模语言模型的开源框架

Megatron-LM是由NVIDIA开发的开源工具，专注于高效训练大规模语言模型。它利用优化的并行策略和计算设计，使开发者能够在多GPU环境中快速构建超大规模参数模型。该平台强调性能和可扩展性，代码清晰且社区反馈活跃，特别适合处理大规模语言模型的研究人员和企业，推动自然语言处理技术的边界。

Follow开源项目 – 高效个性化的信息浏览平台

Follow 是一个开源项目，旨在通过整合多种信息源和先进技术，为用户提供更高效、更个性化的信息浏览体验。它将内容整合到一个时间线中，帮助用户专注于重要信息，避免噪音干扰。用户可以订阅各种信息源、分享列表、探索收藏，并享受无干扰的浏览体验。

GenWarp开源项目 – 单图生成多视角图像

GenWarp是一种从单张图像生成不同视角新图像的方法。它能够在保留原始图像重要信息和细节的同时，生成视角变化后的图像，确保信息不会丢失或扭曲。该项目提供了模型的推理代码，用户可以通过输入图像和相机姿态生成新视角图像。

ARBORproject开源项目 – 加速AI推理模型解读的开放协作平台

ARBORproject是一个通过开放协作加速AI推理模型解读与研究的项目。它旨在通过公开分享早期成果、提供多种参与方式以及采用类似开源软件的开放模式，推动社区在AI推理模型领域的快速进步。该项目鼓励研究者公开合作，共同分析AI推理模型，并通过社区协作加速这一领域的发展。

StyleLLM开源项目 – 基于大语言模型的文本风格迁移

StyleLLM文风大模型是一个文本风格迁移项目，基于大型语言模型，提供四个经过中国四大名著训练的模型，能够支持多种文本风格的转换，适用于各种语言处理场景。

kro开源项目 – 简化Kubernetes资源管理

Kubernetes资源编排的利器，让复杂资源管理变得简单高效。kro通过定义复杂多资源构造为可复用组件，简化资源管理，动态创建和管理底层资源，无缝集成现有工具，并持续优化和改进中。

AI Agents for Beginners开源项目 – 微软AI智能体入门课程

微软全新推出的AI智能体入门基础课程，专为初学者设计，涵盖构建AI智能体的基础知识。课程共包含10个教学单元，每个单元专注于一个特定主题，并提供可运行的代码示例。课程支持多语言版本，包括中文翻译，方便全球学习者参与。此外，课程还提供额外学习资源的链接，并计划下个月发布配套视频，以进一步辅助学习。

DeepFace开源项目 – 开源人脸识别与检测工具

DeepFace是一个基于开源框架实现的人脸识别、脸脸检测和人脸关键点检测等任务的工具。它提供了多种功能，适用于各种人脸相关的应用场景，并且可以作为开源项目进行二次开发，满足个性化需求。

Taxy AI开源项目 – 智能浏览器自动化工具

Taxy AI 是一个开源的浏览器自动化库，利用开放域语言模型 GPT-4 来控制浏览器并执行重复任务，旨在提高工作效率和简化日常操作。

MonitorControl开源项目 – Mac外接显示器控制工具

MonitorControl 是一款 Mac 应用程序，允许用户像控制原生 Apple 显示器一样控制外接显示器的亮度和音量。它支持使用 Apple 键盘的按键或自定义快捷键进行操作，并在调整时显示 macOS 的原生屏幕显示（OSD）。

GUI-Thinker开源项目 – 全自动桌面GUI代理

GUI-Thinker是一款全自动桌面GUI代理，具备批判性思维，能够自动化完成复杂的桌面操作。它无需Docker或虚拟机，部署简便，支持多种语言模型，如GPT-4o和Gemini-2.0。通过Step-Check和Actor-Critic模块，确保每一步操作都精准无误，从而显著提高工作效率并减少人为错误。

R1-Searcher开源 – 提升LLM搜索能力的强化学习框架

R1-Searcher 是一个两阶段强化学习框架，旨在提升大型语言模型（LLM）的搜索能力。该框架通过结果导向的奖励机制工作，无需依赖过程奖励或知识蒸馏。研究表明，它允许 LLM 在推理过程中自主调用外部搜索系统，整合外部知识来解决知识密集型查询。在某些基准测试中，R1-Searcher 的表现显著优于现有的检索增强生成（RAG）方法，甚至与闭源模型（如 GPT-4o-mini）相当或更优。

Apache ECharts开源项目 – 强大的JavaScript图表库

Apache ECharts 是一个基于 JavaScript 的开源可视化库，专门用于生成各种交互式和高度可定制的图表。它支持多种图表类型，包括折线图、柱状图、饼图、地图和关系图等。ECharts 提供了强大的交互能力，支持数据缩放、拖拽、动态更新和图表联动效果。它兼容各种主流浏览器，并且可以无缝集成到微信小程序、Node.js 等平台。ECharts 采用 Canvas 和 SVG 双渲染引擎，能够高效处理大规模数据，渲染速度快。此外，ECharts 提供了丰富的配置选项，用户可以通过调整配置项来定制图表的每一个细节，从颜色到动画都可以自由调整。

暂无评论

暂无评论...