所有AI工具AI开发框架AI开源项目AI编程工具

AutoGPTQ开源项目 – 大语言模型量化工具

AutoGPTQ 是一个基于 GPTQ 算法的大语言模型量化包,旨在帮助开发人员释放大语言模型的全部潜力。它提供了用户友好的 API,支持多种大语言模型的量化,能够在推理中显著提高模型的...

标签:

AI交流(进群备注:AutoGPTQ)

AutoGPTQ 是一个基于 GPTQ 算法的大语言模型量化包,旨在帮助开发人员释放大语言模型的全部潜力。它提供了用户友好的 API,支持多种大语言模型的量化,能够在推理中显著提高模型的性能。AutoGPTQ 支持多种量化配置,并且与 Hugging Face 的 Transformers、Optimum 和 PEFT 等库无缝集成,使得 GPTQ 模型的运行和训练更加便捷。

AutoGPTQ的特点:

  • 1. 基于 GPTQ 算法的高效量化
  • 2. 支持多种大语言模型(如 LLaMA、GPT-J、OPT 等)
  • 3. 用户友好的 API,易于集成和使用
  • 4. 支持多种量化配置(如 4-bit 量化)
  • 5. 与 Hugging Face 生态系统无缝集成
  • 6. 支持 Triton 后端,提升推理速度
  • 7. 支持模型的下游任务评估

AutoGPTQ的功能:

  • 1. 通过简单的 API 进行模型量化和推理
  • 2. 将量化后的模型保存到本地或推送到 Hugging Face Hub
  • 3. 使用预定义的评估任务对量化模型进行性能评估
  • 4. 自定义模型扩展,支持更多模型类型
  • 5. 使用 Marlin 内核进行高效混合精度计算

相关导航

暂无评论

暂无评论...