Liger-Kernel 是一款专为大型语言模型(LLM)训练设计的高效 Triton 内核。它通过一行代码即可集成到现有训练流程中,显著提升模型性能,降低内存使用,并支持更长上下文长度、更大批量大小和庞大词汇量。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型