大模型训练 | 第 2 页

深度语言模型：中国AI技术的新里程碑与未来挑战

本文探讨了中国在深度语言模型领域的最新突破，以DeepSeek R1为例，分析了其在算法创新、开源生态和普惠AI方面的贡献。文章还展望了未来AI技术的发展方向，强...

AI快讯

3个月前

17家国产AI芯片公司宣布全面接入DeepSeek模型服务，包括华为昇腾、沐曦等。这一合作将提升国产AI芯片的计算效率和应用效果，推动技术自主与生态共建。DeepSee...

AI快讯

3个月前

17家国产AI芯片公司宣布全面接入DeepSeek模型服务，包括华为昇腾、沐曦等。这一合作将提升国产AI芯片的计算效率和应用效果，推动技术自主与生态共建。DeepSee...

AI快讯

3个月前

奥飞数据与腾讯、阿里、华为在数据中心、云计算、AI算力等领域展开深度合作，支持大模型训练、推理场景及跨境业务算力需求。公司积极布局AI算力基建，通过采...

AI快讯

3个月前

DeepSeek-V3通过创新的混合精度计算框架，显著降低了大模型训练的资源消耗。本文将深入探讨其FP8混合精度技术的核心优势，以及如何通过细粒度量化和策略性精...

AI快讯

3个月前