标签:开源AI
Hopper GPU的革命性突破:DeepSeek开源FlashMLA解码内核
DeepSeek在2025年开源了针对Hopper GPU优化的FlashMLA解码内核,专为处理可变长度序列设计。通过动态调度和内存优化,FlashMLA大幅提升了AI模型的解码效率,...
DeepSeek-R1模型:AI基建产业链的变革者
花旗分析师Atif Malik和Asiya Merchant等发布研报,详细分析了DeepSeek的R1模型对AI基建产业链各环节的潜在影响。报告指出,DeepSeek的高性价比训练技术将推...
DeepSeek-V3全精度满血版:开源AI模型的革命性突破
文章探讨了DeepSeek-V3全精度满血版在开源AI模型领域的革命性突破,分析了其对国产AI芯片厂商的影响,以及混合精度训练技术的应用和市场前景。
Tülu 3模型:开源AI的新星与行业变革
本文探讨了艾伦人工智能研究所开源的Tülu 3模型在AI领域的影响,分析了其与DeepSeek等模型的竞争关系,以及开源AI在推动行业变革中的重要作用。
Mamba模型:开源AI的未来与挑战
本文深入探讨了Mamba模型的开源代码、架构及其在AI行业中的技术价值与未来发展方向,分析了其核心技术细节、开源模块构成及行业影响。
DeepSeek开源MLA解码内核FlashMLA:突破GPU算力瓶颈的新里程碑
DeepSeek开源了针对Hopper GPU优化的MLA解码内核FlashMLA,通过低秩注意力机制和动态序列优化,显著提升AI推理效率,突破GPU算力瓶颈,为AI行业带来技术红利。