标签:大模型训练
深度语言模型:中国AI技术的新里程碑与未来挑战
本文探讨了中国在深度语言模型领域的最新突破,以DeepSeek R1为例,分析了其在算法创新、开源生态和普惠AI方面的贡献。文章还展望了未来AI技术的发展方向,强...
国产AI芯片与DeepSeek模型服务的深度融合:技术自主与生态共建的新篇章
17家国产AI芯片公司宣布全面接入DeepSeek模型服务,包括华为昇腾、沐曦等。这一合作将提升国产AI芯片的计算效率和应用效果,推动技术自主与生态共建。DeepSee...
昇腾AI芯片与DeepSeek模型服务的深度融合:技术自主与生态共建的新篇章
17家国产AI芯片公司宣布全面接入DeepSeek模型服务,包括华为昇腾、沐曦等。这一合作将提升国产AI芯片的计算效率和应用效果,推动技术自主与生态共建。DeepSee...
AI智算新纪元:奥飞数据与科技巨头的深度合作
奥飞数据与腾讯、阿里、华为在数据中心、云计算、AI算力等领域展开深度合作,支持大模型训练、推理场景及跨境业务算力需求。公司积极布局AI算力基建,通过采...
混合精度计算:DeepSeek-V3如何推动大模型训练效率革命
DeepSeek-V3通过创新的混合精度计算框架,显著降低了大模型训练的资源消耗。本文将深入探讨其FP8混合精度技术的核心优势,以及如何通过细粒度量化和策略性精...
1
2