标签:推理引擎
混合专家模型(MoE):推动大模型技术革新的核心力量
本文深入探讨了混合专家模型(MoE)在大模型技术中的核心作用,分析了其架构创新、训练优化及实际应用。通过DeepSeek-V3、R1等案例,展示了MoE在提升计算效率...
DeepSeek模型推动国产DCU算力卡升级,海光信息引领AI生态发展
随着DeepSeek多款AI模型的发布,国产AI算力卡迎来新一轮升级。海光信息凭借其高性能DCU产品,迅速完成DeepSeek模型的适配,推动国产AI生态发展。本文探讨了De...