Native Sparse Attention Triton 是一个基于Triton实现的高效原生稀疏注意力(NSA)机制工具,专为大规模训练加速而设计。它通过优化稀疏注意力计算,显著提升了性能,并支持多种稀疏注意力模式,具有高度的灵活性。项目提供了完整的测试和基准,用户可以直观地评估不同稀疏注意力模式的优化效果。