GPU优化 | AI-magic

DualPipe：并行计算的智慧协调者，AI效率的革命性提升

本文深入探讨了DeepSeek开源项目中的DualPipe技术，揭示了其如何通过智能任务调度和资源分配，解决并行计算中的混乱问题，大幅提升AI计算的效率与性能。DualP...

AI快讯

3个月前

本文深入探讨了DeepSeek R1模型在测试时间缩放技术上的创新，如何通过低秩KV压缩和动态负载均衡显著降低AI推理成本，并分析了其对GPU、光模块等AI基建产业链...

AI快讯

3个月前

稀疏注意力核是提升AI推理效率的关键技术之一，通过减少全局自注意力的计算成本，显著提高了Transformer模型在下游任务中的性能。本文探讨了稀疏注意力核的技...

AI快讯

3个月前

本文深入探讨混合精度调度器在AI计算中的关键作用，结合DeepSeek的PTX优化技术和NVIDIA Triton推理服务器的创新，揭示其在提升AI模型训练和推理效率中的巨大...

AI快讯

3个月前

本文探讨了DeepSeek及其开源项目如何通过技术创新推动AI普惠化。文章详细介绍了DeepSeek-R1模型的技术突破，以及KTransformers和FlashMLA等开源项目在降低AI...

AI快讯

3个月前

DeepSeek通过开源FP8训练技术，展示了其在AI算力优化领域的领先地位。其创新的FP8通用矩阵乘法库DeepGEMM，不仅大幅提升了GPU性能，还降低了训练成本，为AI行...

AI快讯

4个月前

DeepSeek开源了针对Hopper GPU优化的MLA解码内核FlashMLA，通过低秩注意力机制和动态序列优化，显著提升AI推理效率，突破GPU算力瓶颈，为AI行业带来技术红利。

AI快讯

4个月前