低成本AI | AI-magic

稀疏神经网络训练：DeepSeek如何推动AI技术的普及与创新

DeepSeek通过开源其低成本AI模型和稀疏神经网络训练方法，显著提高了推理效率并降低了计算和能源需求。这一举措不仅推动了全球AI技术的普及，还促进了新的人...

AI快讯

3个月前

DeepSeek是一家中国的人工智能初创公司，其创始人梁文峰带领团队开发了R1模型，通过开源和低成本策略，推动了全球AI技术的普及和创新。R1模型采用稀疏神经网...

AI快讯

3个月前

DeepSeek-V3是深度求索于2024年12月发布的一款采用混合专家架构的大型语言模型，其低成本高效率的特点引发业界关注。本文深入探讨了DeepSeek-V3的架构创新、...

AI快讯

3个月前

李飞飞团队以不到50美元的成本训练出名为s1的AI推理模型，该模型在数学和编码测试中表现优异。s1模型的训练基于阿里云通义千问模型进行监督微调，展示了低成...

AI快讯

3个月前

DeepSeek-R1作为一款革命性的AI模型，凭借其创新的GRPO算法和低成本高性能的特点，正在改变AI开发的格局。本文深入探讨其技术原理、学习过程、开源策略及其对...

AI快讯

3个月前

DeepSeek V2.5以其低成本和高性能在AI领域掀起了一场革命。通过创新的技术优化和开源策略，DeepSeek不仅挑战了美国AI的领先地位，还在全球范围内推动了AI的普...

AI快讯

3个月前

DeepSeek V2作为中国创新型科技公司幻方量化的杰作，以其低成本和高效能的大语言模型技术引领AI领域。本文将深入探讨DeepSeek V2的技术特点、市场影响及其在...

AI快讯

3个月前

DeepSeek-R1 是一款由中国杭州深度求索公司开发的高性能AI推理模型，专注于数学、代码和自然语言推理任务。该模型通过强化学习和多阶段训练技术实现高效推理...

AI快讯

3个月前

DeepSeek-R1 是由中国杭州深度求索公司开发的一款高性能AI推理模型，专注于数学、代码和自然语言推理任务。该模型通过强化学习技术进行训练，并在多个基准测...

AI快讯

3个月前

本文深入探讨了DeepSeek模型的核心价值及其在节省算力方面的突破。通过优化算法，DeepSeek用较少的算力训练出与当前最强大模型能力相当的模型，并应用了“蒸馏...

AI快讯

3个月前