深度与广度学习框架(Deep and Wide Learning,简称DWL)是一种结合宽线性模型和深神经网络的框架,旨在提升深度学习模型的准确性和计算效率。该框架特别适用于处理稀疏输入数据,通过协同学习数据内部和数据间的表征,显著改善推荐系统、分类和回归任务的性能。DWL最初由Google研究团队提出,主要用于推荐系统,如YouTube视频推荐,结合了宽线性模型的记忆能力和深神经网络的泛化能力。
Native Sparse Attention是一个高效实现原生稀疏注意力的Triton代码库,专注于在深度学习模型中优化注意力机制。通过硬件对齐优化和动态选择稀疏块,显著提升了性能,比FlashAttention更快,性能提升高达数倍。适用于需要高效处理稀疏数据的场景,并在AI创造营等项目中得到应用。