标签:deepseek

DeepSeek:从推理大模型到AI生态的崛起

本文探讨了DeepSeek作为推理大模型的崛起历程、技术优势、应用场景及生态展望,分析了其在AI领域的突破性贡献及未来潜力。

Tülu 3模型:开源AI的新星与行业变革

本文探讨了艾伦人工智能研究所开源的Tülu 3模型在AI领域的影响,分析了其与DeepSeek等模型的竞争关系,以及开源AI在推动行业变革中的重要作用。

DeepSeek:国产AI引领科技与生活方式变革

本文探讨了DeepSeek为代表的国产AI技术对科技发展和普通人生活方式的深远影响,从技术创新到日常生活的多个领域,展现了AI带来的变革。

DeepSeek的MTP技术:多Token预测如何推动AI推理效率

本文深入探讨DeepSeek模型中的MTP(多Token预测)技术,分析其如何通过一次预测多个Token提升推理效率,降低训练成本,并推动AI模型的性能优化。

DeepSeek的MoE架构:AI领域的技术革新与成本优化

本文深入探讨了DeepSeek在AI领域的技术革新,特别是其混合专家架构(MoE)的创新点。文章详细介绍了DeepSeek如何通过MoE架构实现低成本训练、工程优化和架构...

DeepSeek R1:AI领域的新星,技术与成本的完美平衡

本文深入探讨了DeepSeek R1这一AI模型的技术能力与创新点,分析了其低成本训练、工程优化和架构创新,并与ChatGPT进行了对比。同时,文章还展望了DeepSeek的...

DeepSeek开源周:MoE模型训练与推理的技术革新

本文深入探讨了DeepSeek在开源周中发布的MoE模型相关技术,包括DeepEP通信库和DeepGEMM库,分析了其在AI训练与推理中的技术突破与行业影响。

DeepSeek开源MLA解码内核FlashMLA:突破GPU算力瓶颈的新里程碑

DeepSeek开源了针对Hopper GPU优化的MLA解码内核FlashMLA,通过低秩注意力机制和动态序列优化,显著提升AI推理效率,突破GPU算力瓶颈,为AI行业带来技术红利。

DeepSeek技术引领A股市场新浪潮,天娱数科等公司受益显著

DeepSeek技术在A股市场持续发酵,天娱数科等多家公司与DeepSeek合作或部署其模型,导致相关股票大涨。这些合作对公司的业务产生了积极影响,如快速开发智能应...

神州鲲泰携手DeepSeek:引领企业智能化转型新浪潮

神州鲲泰通过深度适配DeepSeek大模型,推出私有化部署与信创一体机解决方案,帮助企业突破AI落地瓶颈,实现降本增效与业务创新。
1 66 67 68 69