所有AI工具AI其他工具AI开源项目

Caldera开源项目 – 高效压缩大型语言模型

Caldera是一种后训练压缩方法,通过低秩、低精度分解技术来表示大型语言模型的权重矩阵。该方法在少于2.5比特/参数的极致压缩下,性能超越现有技术,并支持低秩适应性微调,针对特...

标签:

AI交流(进群备注:Caldera)

Caldera是一种后训练压缩方法,通过低秩、低精度分解技术来表示大型语言模型的权重矩阵。该方法在少于2.5比特/参数的极致压缩下,性能超越现有技术,并支持低秩适应性微调,针对特定任务进一步优化。Caldera提供灵活的精度设置,可针对不同组件调整量化精度,以平衡性能和压缩率。

Caldera的特点:

  • 1. 在少于2.5比特/参数的极致压缩下,性能超越现有技术
  • 2. 支持低秩适应性微调,针对特定任务进一步优化
  • 3. 灵活的精度设置,可针对不同组件调整量化精度

Caldera的功能:

  • 1. 用于压缩大型语言模型,减少模型体积
  • 2. 在特定任务上通过微调进一步优化模型性能
  • 3. 根据不同组件需求,灵活调整量化精度以平衡性能和压缩率

相关导航

暂无评论

暂无评论...