Kolmogorov-Arnold Transformer (KAT) 是一个基于PyTorch和GPU加速的实现,旨在通过替换传统Transformer中的MLP层为KAN层,从而在大规模训练场景下显著提升模型性能。该项目专为需要高效处理大规模数据的深度学习任务设计,支持与现有PyTorch项目的无缝集成。