推理效率 | AI-magic

稀疏神经网络训练：DeepSeek如何推动AI技术的普及与创新

DeepSeek通过开源其低成本AI模型和稀疏神经网络训练方法，显著提高了推理效率并降低了计算和能源需求。这一举措不仅推动了全球AI技术的普及，还促进了新的人...

AI快讯

3个月前

本文介绍了SOLAR框架，一种通过动态优化推理拓扑结构来提升大规模语言模型（LLMs）推理精度和效率的创新方法。SOLAR通过拓扑标注生成系统（TAG）和拓扑缩放技...

AI快讯

3个月前

本文深入探讨了自结构化推理链SCoT和过程奖励模型PRM在AI推理中的应用。SCoT通过动态生成适配不同复杂度问题的推理结构，解决了现有方法在推理多样性和效率上...

AI快讯

3个月前

DeepSeek R1作为一款高效AI大模型，凭借稀疏架构、强化学习与开源策略，显著降低了推理成本并提升了性能。本文深入探讨其技术突破、开源影响及在AGI道路上的...

AI快讯

3个月前

DeepSeek大模型凭借其创新的MLA技术，在春节期间成为市场焦点。多家上市公司宣布接入该模型，引发A股市场涨停潮。本文将深入探讨DeepSeek大模型的MLA技术，分...

AI快讯

3个月前

本文深入探讨了DeepSeek在测试时间缩放技术上的创新，如何通过低秩KV压缩、FP8矩阵计算和优化通信策略，显著提升AI推理与训练的效率。文章还分析了这些技术对...

AI快讯

3个月前

本文深入探讨DeepSeek如何通过缩放定律推动AI模型的成本革命，分析其R1模型在推理效率与成本优化上的突破，以及对AI基建产业链的深远影响。从预训练到测试时...

AI快讯

3个月前

DeepSeek的R1模型通过创新技术大幅降低AI模型的训练和推理成本，成为“测试时间缩放”的典范。本文深入探讨缩放定律的三个阶段，分析DeepSeek如何通过算力平权...

AI快讯

3个月前

苹果研究团队在iPhone 12平台上开发了名为MobileOne的轻量化神经网络架构，实现了低于1毫秒的推理时延和75.9%的识别精度。本文将探讨MobileOne的技术亮点，并...

AI快讯

4个月前

本文探讨了GhostNet在移动端轻量化神经网络中的应用，分析了其在ImageNet数据集上的表现，并比较了多种移动端轻量化神经网络模型的优缺点，展望了未来发展方向。

AI快讯

4个月前