ChatGLM-6B-QLoRA开源项目 – 高效微调与量化ChatGLM模型

ChatGLM-6B-QLoRA项目利用peft库实现了对chatGLM-6B和chatGLM2-6B模型的4bit QLoRA高效微调，并提供了模型的合并和量化功能。该项目包含了完整的训练和推理流程，以及推理性能测试，旨在优化模型存储和计算资源的使用。

ChatGLM-6B-QLoRA的特点:

1. 4bit的QLoRA高效微调
2. 支持chatGLM-6B和chatGLM2-6B模型
3. 模型的合并（merge）功能
4. 4bit的量化（quantize）
5. 完整的训练流程
6. 完整的推理流程
7. 推理性能测试

ChatGLM-6B-QLoRA的功能:

1. 高效微调chatGLM-6B/chatGLM2-6B模型
2. 合并lora model和base model
3. 量化模型以减少存储和计算资源
4. 进行模型的训练和推理
5. 测试模型的推理性能

相关导航

AI-Bootcamp开源项目 – 自定进度的生成式AI训练营

一个自定进度的生成式AI训练营，帮助你快速掌握机器学习和AI的核心技能。

D8VK开源项目 – Direct3D 8 转 Vulkan 的转换层

D8VK 是 DXVK 的 Direct3D 8 实现，提供了一个基于 Vulkan 的转换层，用于将 Direct3D 8 调用转换为 Vulkan API。该项目旨在支持在非 Windows 平台上运行 Direct3D 8 应用程序，并提供更好的图形性能和稳定性。D8VK 继承了 DXVK 的高效性和兼容性，是一个开源项目，允许社区贡献和改进。

MotleyCrew开源项目 – 高效整合多种AI框架的开源项目

MotleyCrew是一个开源项目，旨在高效整合多个AI Agents，支持多种流行框架如Langchain、LlamaIndex、CrewAI等，提供输出结果验证工具，让用户能够专注于高层次设计，而处理数据传输和功能交互等细节部分。

Open-R1-Multimodel开源项目 – 多模态强化学习模型

Open-R1-Multimodel是基于Huggingface的Open-R1和deepseek-ai/DeepSeek-R1实现的多模式R1模型。它集成了Qwen2-VL系列、Aria-MoE等VLM transformers，并开源了首批8k专注于数学推理的多模态强化学习训练示例。数据由GPT4o创建，具有推理路径和可验证答案，基于Math360K和Geo170K数据集。

sqlTranslate官网 – 自然语言与SQL代码互转工具

sqlTranslate是一个开源项目，用户可以通过自然语言输入查询，获取相应的SQL代码；或者输入SQL代码，得到易于理解的自然语言翻译。该工具完全免费，旨在简化数据库查询的学习和使用过程。

AIGODLIKE-ComfyUI-Translation开源项目 – ComfyUI多语言翻译插件

AIGODLIKE-ComfyUI-Translation 是一款为 ComfyUI 提供的多语言翻译插件，支持将 ComfyUI 的界面、菜单、节点等内容翻译成多种语言，包括简体中文、繁体中文、英语、日语、韩语等。该插件允许用户自由切换语言，并支持自定义节点的翻译。虽然由于 ComfyUI 框架的更新，该项目已停止维护，但其功能仍然为大量用户提供了便利。

Open R1官网 – 复现和整理 Deepseek R1 相关内容

Huggingface 整理并发布了关于 Deepseek R1 的所有重要内容和社区工作，包括评估分数复现、训练管道复现、合成数据生成流程、重要人物对 R1 模型的表态以及尝试复现 R1 的开源项目。该项目旨在为研究人员和开发者提供一个全面的资源，以便更好地理解和复现 Deepseek R1 模型。

MarkLLM开源项目 – 在LLM中实现水印的工具包

MarkLLM是一个专门用于在大型语言模型(LLM)中实现水印的研究和应用的工具包，旨在提供水印的生成、检测及其对模型性能的研究，助力学术和工业界的相关探索。

Babel-LLM开源项目 – 开源多语言大模型

Babel是阿里巴巴开源的多语言大模型，支持25种主流语言，覆盖全球90%以上的人口。它提供了9B和83B两个版本，9B专为高效的多语言大模型推理和微调设计，适合研究和本地部署；而83B性能更好，但消耗的资源也更多。Babel的创新之一是采用了层扩展技术，通过在模型中插入额外的层来增加参数数量从而提升模型的性能。预训练方面，Babel采用了两阶段预训练策略：第一阶段是恢复阶段，目标是恢复模型在扩展过程中可能损失的性能；第二阶段是持续训练阶段，重点提升模型的多语言能力，尤其是低资源语言。Babel在多个主流基准测试中表现出色，尤其是在多语言推理、理解和翻译方面。

vhAstro-Theme开源项目 – 优雅响应式博客主题

vhAstro-Theme 是一个基于 Astro 构建的优雅的响应式博客主题，设计简洁，动画流畅，页面过渡顺畅。它支持混合使用 React、Vue、Svelte 等主流框架的组件，适合用于搭建个人博客、创建文档站或以内容为主的网站。

Naive UI Admin开源项目 – 基于Vue3的中后台解决方案

Naive UI Admin 是一款完全免费且可商用的中后台解决方案，基于 Vue3.0、Vite、Naive UI 和 TypeScript 构建。它集成了最新的前端技术栈，提供了二次封装组件、动态菜单、权限校验等功能，适用于快速搭建企业级中后台项目。项目具有响应式设计、多主题支持、强大的鉴权系统，并且持续更新页面模板和交互设计，简化页面构建流程。

ReactAgent开源项目 – 开源的React.js自主LLM代理

ReactAgent是一个开源项目，旨在为React.js应用提供自主交互能力，支持多种大型语言模型，便于设置和自定义，能够实现实时用户交互。

ChatPDF开源项目 – 基于PDF的问答工具

为ChatGLM/LLaMA等多种LLM提供了一个好用的基于PDF问答的图形界面，用户可以通过上传PDF文件与模型进行交互，获取所需的信息，界面友好，操作简单，适合各类用户使用。

F5-TTS开源项目 – 基于Flow Matching的语音合成

F5-TTS是一个基于Flow Matching的语音合成项目，旨在生成流畅且高度还原的语音。它通过Diffusion Transformer架构和ConvNeXt V2模块，结合创新的Sway Sampling策略，显著提升了训练和推理速度。项目支持多语言、多风格和多说话者的语音生成，并提供了丰富的工具和接口，如Gradio应用、CLI推理和Docker支持。

LangGraph 101开源项目 – 掌握LangGraph框架的教程

LangGraph 101 是由 LangChain 团队设计的免费教程，旨在帮助用户掌握 LangGraph 框架，用于构建精确可控的 AI 智能体和多智能体应用。通过一系列笔记本教程，涵盖从基础到高级的 LangGraph 知识，并提供开源案例代码，便于快速上手实践。教程还包括环境搭建指南、集成 Azure OpenAI 方案，以及流式处理、断点和状态编辑等人机交互功能。

暂无评论

暂无评论...