标签:训练成本

NSA:中国AI技术的新里程碑

中国团队DeepSeek实验室发布的NSA技术,通过革命性的稀疏注意力算法,显著提升了AI推理速度,降低了训练成本,并在多个领域展示了其应用潜力。NSA的动态稀疏...

AGI到SGI的快速过渡:AI大模型训练成本的降低与未来世界的挑战

本文探讨了AI大模型训练成本的降低以及AI模型的高频次开发更新迭代,预测了从AGI(人工通用智能)到SGI(超级智能)的快速过渡,并表达了对未来世界的担忧和...

DeepEP:混合专家模型的“AI快递高速路系统”

DeepSeek于2025年2月25日开源的DeepEP通信库,专为混合专家模型(MoE)设计,通过优化NVLink和RDMA技术,实现了极速传输、智能分拣与压缩,显著降低训练成本...

DeepSeek R1模型:中国AI领域的“阿里IPO时刻”

美银报告指出,DeepSeek R1模型可能成为中国AI领域的“阿里IPO时刻”,通过降低硬件依赖和训练成本,推动中国AI的普惠化,并影响全球AI生态系统。此外,DeepSee...

DeepSeek的R1推理模型:中国AI领域的“阿里IPO时刻”

美银报告指出,DeepSeek的R1推理模型在降低硬件依赖的同时实现了高性能,显著降低了训练成本,推动中国AI领域的发展。DeepSeek的技术突破将推动中国AI的普惠...