标签:大模型训练

深度语言模型:中国AI技术的新里程碑与未来挑战

本文探讨了中国在深度语言模型领域的最新突破,以DeepSeek R1为例,分析了其在算法创新、开源生态和普惠AI方面的贡献。文章还展望了未来AI技术的发展方向,强...

国产AI芯片与DeepSeek模型服务的深度融合:技术自主与生态共建的新篇章

17家国产AI芯片公司宣布全面接入DeepSeek模型服务,包括华为昇腾、沐曦等。这一合作将提升国产AI芯片的计算效率和应用效果,推动技术自主与生态共建。DeepSee...

昇腾AI芯片与DeepSeek模型服务的深度融合:技术自主与生态共建的新篇章

17家国产AI芯片公司宣布全面接入DeepSeek模型服务,包括华为昇腾、沐曦等。这一合作将提升国产AI芯片的计算效率和应用效果,推动技术自主与生态共建。DeepSee...

AI智算新纪元:奥飞数据与科技巨头的深度合作

奥飞数据与腾讯、阿里、华为在数据中心、云计算、AI算力等领域展开深度合作,支持大模型训练、推理场景及跨境业务算力需求。公司积极布局AI算力基建,通过采...

混合精度计算:DeepSeek-V3如何推动大模型训练效率革命

DeepSeek-V3通过创新的混合精度计算框架,显著降低了大模型训练的资源消耗。本文将深入探讨其FP8混合精度技术的核心优势,以及如何通过细粒度量化和策略性精...
1 2