标签:MoE大模型

DeepSeek:中国AI新星如何用MoE大模型挑战OpenAI?

中国AI新创公司深度求索(DeepSeek)发布的DeepSeek-V3和DeepSeek-R1两款大模型,凭借混合专家(MoE)架构和创新的训练方法,性能与OpenAI相当,引发了全球AI...