标签:开源技术
DeepEP开源:推动MoE模型训练与推理的高性能通信革命
DeepSeek宣布开源DeepEP,这是一款专为MoE模型训练和推理优化的高性能通信库。DeepEP支持FP8低精度计算,并针对NVLink和RDMA场景进行深度优化,显著提升通信...
DeepSeek-V3模型:AI大模型领域的效率革命与生态扩展
DeepSeek-V3模型凭借其创新的MoE架构、MLA注意力机制和强化学习技术,成为AI大模型领域的效率革命代表。通过与联想、华为等企业的合作,DeepSeek不仅在政务、...
DeepSeek:中国大模型的崛起与安全挑战
国产大模型DeepSeek在全球AI领域表现出色,但面临网络攻击威胁。360集团创始人周鸿祎宣布为DeepSeek提供全方位网络安全防护,强调国产技术的安全性和稳健性。...
DeepSeek-R1:AI技术革新与行业影响
DeepSeek-R1作为中国领先的AI大模型,通过强化学习和蒸留技术实现了低成本高效益的突破,不仅对科技巨头如NVIDIA的股价产生影响,还推动了腾讯等公司在搜索业...
DeepSeek:AI基建的新引擎与普惠未来的里程碑
DeepSeek凭借其R1模型和开源技术,正在推动AI基建产业链的革新。本文探讨了DeepSeek在AI模型广泛采用中的关键作用,分析了其对GPU、光模块等细分领域的影响,...
DeepSeek-V3:中国AI领域的破局者与全球科技风暴的引领者
DeepSeek-V3作为中国AI领域的破局者,凭借其高效、低成本的开源技术,迅速在全球范围内引发关注。本文探讨了DeepSeek-V3的技术突破、市场影响及其背后的创始...
DeepSeek-V3:AI大模型的革命性突破与梁文锋的技术远见
文章深入探讨了DeepSeek-V3的技术创新及其在人工智能领域的革命性影响。DeepSeek-V3作为一款拥有6710亿参数的混合专家模型,通过多头潜注意力和无辅助损失负...
DeepSeek:人工智能领域的颠覆者与全球竞争的新格局
DeepSeek的横空出世不仅改变了全球人工智能领域的竞争格局,还推动了开源技术的发展。本文探讨了DeepSeek对国内外人工智能发展的影响,分析了其在算法优化、...
阿里巴巴开源万相2.1:引领AI视频生成技术新浪潮
阿里巴巴宣布全面开源其全球领先的视频生成模型万相2.1,基于Apache2.0协议,支持文生视频和图生视频任务。该模型通过高效VAE和DiT架构,实现了无限长1080P视...
DeepSeek-R1:中国大模型的崛起与AI未来的挑战
2025年初,中国大模型DeepSeek-R1以低成本高性能迅速崛起,绕开英伟达生态适配国产芯片,引发全球关注。专家预测2025年将是人类智力领先AI的最后一年,OpenAI...