AI训练 | 第 3 页

梯度反向传播：AI学习的核心引擎

本文深入探讨了梯度反向传播在深度学习中的核心作用，详细解释了其基本原理、优化策略及其在AI模型训练中的应用。通过分析DeepSeek-R1、GPT-4等先进模型，展...

AI快讯

2个月前

本文深入探讨了DeepSeek在测试时间缩放技术上的创新，如何通过低秩KV压缩、FP8矩阵计算和优化通信策略，显著提升AI推理与训练的效率。文章还分析了这些技术对...

AI快讯

2个月前

NVIDIA在2024年第四季度财报电话会议中总结了10个主要信息点，强调了公司在生成式人工智能、大型语言模型、数据中心基础设施和加速计算领域的显著增长和创新...

AI快讯

2个月前

本文探讨了汉语和英语在科技词汇创新与AI训练中的不同表现，通过OpenAI、字节跳动等实例，展示了汉语在简洁性和创新重组上的优势。同时，文章还提到了汉字在...

AI快讯

2个月前

本文探讨了ARM NPU在边缘AI中的应用前景，分析了ASIC芯片如何通过低功耗、低成本优势打破GPU垄断。文章还结合国科微、TrendForce等机构的观点，深入解析了AI...

AI快讯

2个月前

本文探讨了ASIC芯片在AI推理与训练中的应用前景，指出其有望打破GPU垄断，并具备功耗和成本优势。文章还提到AI算法向Transformer收敛，深度学习框架以PyTorch...

AI快讯

2个月前

本文探讨了ASIC芯片在AI推理与训练中的广泛应用前景，分析了其如何打破GPU垄断，并在功耗、成本方面展现出显著优势。文章还结合多家公司和机构的观点，深入剖...

AI快讯

2个月前

本文探讨了特斯拉Robotaxi的技术突破与监管挑战，详细介绍了其三大专利技术——自动充电、自动消毒和车队管理，并分析了其在全球推广中面临的监管与安全问题。...

AI快讯

2个月前

DeepSeek通过开源优化并行策略，打破GPU资源壁垒，推动AI技术发展。文章探讨了DeepSeek的开源成果、GPU芯片生态的挑战与机遇，以及中国芯片技术的自主创新之路。

AI快讯

2个月前

OpenAI通过Whisper工具转录YouTube视频生成训练数据，尽管可能违反平台规则。科技巨头如谷歌和Meta也在争夺数据资源，甚至考虑使用合成数据。这场AI数据争夺...

AI快讯

2个月前