BitMat 是一个基于 Triton 优化矩阵乘法运算的 Python 软件包,利用自定义内核实现高效性能,旨在改进三元矩阵乘法,基于论文 'The Era of 1-bit LLMs' 提出的方法。它特别适用于大规模语言模型(LLMs)的优化,能够显著提升 GPU 上的矩阵运算性能。