dkernel是一个高性能的定制化CUDA内核库,专注于优化大规模语言模型的稀疏注意力计算。它通过使用OpenAI Triton编写的内核,显著提升了计算效率并降低了资源消耗,特别适用于需要高性能计算的场景。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型