AI交流(进群备注:Caldera)

Caldera是一种后训练压缩方法,通过低秩、低精度分解技术来表示大型语言模型的权重矩阵。该方法在少于2.5比特/参数的极致压缩下,性能超越现有技术,并支持低秩适应性微调,针对特定任务进一步优化。Caldera提供灵活的精度设置,可针对不同组件调整量化精度,以平衡性能和压缩率。
Caldera的特点:
- 1. 在少于2.5比特/参数的极致压缩下,性能超越现有技术
- 2. 支持低秩适应性微调,针对特定任务进一步优化
- 3. 灵活的精度设置,可针对不同组件调整量化精度
Caldera的功能:
- 1. 用于压缩大型语言模型,减少模型体积
- 2. 在特定任务上通过微调进一步优化模型性能
- 3. 根据不同组件需求,灵活调整量化精度以平衡性能和压缩率
相关导航
暂无评论...