标签:FP8混合精度

FP8混合精度框架:DeepSeek-R1模型的技术革新与行业影响

本文深入探讨了DeepSeek-R1模型采用的FP8混合精度框架,分析了其在降低计算成本和提升训练效率方面的显著优势。文章还探讨了该技术对AI行业的深远影响,包括...

DeepSeek-V3:如何在H800 GPU集群上实现高效AI训练

DeepSeek-V3在H800 GPU集群上以557.6万美元的成本实现了与GPT-4比肩的性能,通过FP8混合精度、多层注意力架构和DualPipe并行技术,显著提升了训练效率和资源...