标签:语言模型优化

深入解析DeepSeek AI系统的层级化向量编码与模型优化

本文详细探讨了DeepSeek AI系统在层级化向量编码和模型优化方面的技术突破,包括其6710亿参数模型的性能提升,以及通过改进权重矩阵实现的模型优化策略。同时...

离散扩散语言建模方法:ICML 2024最佳论文的技术突破

ICML 2024最佳论文提出了一种新的离散扩散语言建模方法,通过引入分数熵损失函数显著提升了语言模型的性能。该方法在实验中优于GPT-2,为语言模型优化提供了...