Cerebras在AI联盟中的潜在角色与FP8技术的前景

AI快讯2个月前发布 admin
0 0

Cerebras在AI联盟中的潜在角色与FP8技术的前景

CerebrasAI联盟中的潜在角色

随着全球50家机构联合成立人工智能联盟(AI Alliance),旨在加速人工智能技术的负责任创新与发展,Cerebras作为一家专注于深度学习芯片制造的公司,其潜在角色备受关注。尽管中国和英伟达被排除在外,Cerebras仍有可能通过其技术创新和开源策略,在联盟中发挥重要作用。

Cerebras在AI联盟中的潜在角色与FP8技术的前景

Cerebras在AI联盟中的潜在角色与FP8技术的前景

FP8技术的应用前景

DeepGEMM库的开源

2025年2月25日,DeepSeek开源了其FP8 GEMM库DeepGEMM,这一举措可能推动AI芯片制造商走向新的行业标准。DeepGEMM在NVIDIA的H800上实现了1350+ TFLOPS的性能,并针对密集型和MoE工作负载进行了优化。这一开源库为AMD、Intel甚至Cerebras等芯片制造商提供了一把现成的武器。

技术优势与挑战

DeepGEMM的绝招包括双层累积、细粒度缩放和MoE友好的布局,理论上并不局限于NVIDIA。AMD的MI300X和Intel的Gaudi 3都可以通过调整达到1000+ TFLOPS,充分利用其HBM3带宽。然而,NVIDIA的生态系统固若金汤,CUDA根深蒂固,H200/Blackwell芯片已经通过FP8 Transformer Engines进行反击。将DeepGEMM移植到ROCm或OneAPI并不简单,开发者们喜爱NVIDIA的打磨,PyTorch等框架并没有跳槽的打算。

开源与标准化

DeepSeek的V3训练成本仅为560万美元,与西方模型相比简直是九牛一毛,DeepGEMM在某些矩阵尺寸上比“专家调优的内核”快2.7倍。芯片制造商可以将此作为每FLOP成本的杀手锏来营销,特别是对于那些避开NVIDIA售价3万美元以上的H100的推理重型AI公司。如果AMD或Intel推出一个杀手级的实现,并且开发者们接受,这可能会滚雪球般发展。但NVIDIA80%以上的AI芯片市场份额和软件护城河意味着DeepSeek需要盟友——而且要快。

Cerebras在AI联盟中的潜在角色与FP8技术的前景

结论

Cerebras在AI联盟中的潜在角色和FP8技术的应用前景充满了机遇与挑战。通过开源DeepGEMM库,Cerebras可能推动AI芯片制造商走向新的行业标准,尽管面临NVIDIA的激烈竞争。未来,Cerebras能否在联盟中发挥重要作用,将取决于其技术创新和开源策略的进一步发展。

© 版权声明

相关文章

暂无评论

暂无评论...