标签:MoE模型

昆仑万维“天工大模型3.0”:全球最大MoE模型的突破与应用

昆仑万维发布的“天工大模型3.0”凭借4000亿级参数的MoE混合专家模型架构,成为全球最大、性能最强的MoE模型之一。该模型在自然语言处理、计算机视觉和推荐系统...

DeepSeek开源周:MoE模型训练与推理的技术革新

本文深入探讨了DeepSeek在开源周中发布的MoE模型相关技术,包括DeepEP通信库和DeepGEMM库,分析了其在AI训练与推理中的技术突破与行业影响。
1 2