标签:AI模型训练
专家系统如何助力华为智能驾驶技术革新?
华为最新专利通过专家系统优化AI模型训练,提升自动驾驶车辆的感知与决策能力。本文将深入探讨专家系统在智能驾驶中的应用,分析其如何通过神经网络与专家经...
英伟达H100 GPU:AI革命的幕后推手
英伟达H100 GPU正在成为AI模型训练的核心硬件,从马斯克的xAI到谷歌的Gemma 3,这款GPU在推动AI技术革命中扮演了关键角色。本文将深入探讨H100 GPU在Grok 3和...
DeepSeek的PTX优化:AI模型效率的革命性突破
本文探讨了DeepSeek如何通过PTX编程实现AI模型的高效优化,显著降低了训练成本,并在性能上对标OpenAI的o1模型。文章详细介绍了PTX在GPU加速中的应用,以及De...
AMD Instinct MI300X GPU:推动AI模型训练的新引擎
AMD最新发布的Instinct MI300X GPU在AI模型训练中表现卓越,支持开源语言模型Instella的训练,展现出与当前顶尖模型竞争的性能。本文将深入探讨MI300X的技术...
自监督学习:开启AI模型训练的新纪元
蚂蚁数科的两项研究成果入选ECCV和ICML,展示了自监督学习和强化学习在无需人工标注数据的情况下训练模型的能力。这些成果将推动视频版权保护和智能问答领域...
DeepSeek杭州训练中心:AI算力与液冷技术的完美结合
本文深入探讨了DeepSeek杭州训练中心的核心技术合作,特别是与中科曙光在液冷系统和高性能计算领域的协同创新。文章还分析了这些合作如何提升AI模型训练的效...
AI智能体的多场景应用与未来发展
本文探讨了AI智能体在金融科技、智能语音、大数据、计算机视觉等领域的广泛应用,并深入分析了文生视频、多场景多基座模型等新兴技术。文章还讨论了人机协同...
BERT在AI存储基准测试中的重要性及中国厂商的崛起
MLCommons发布了最新的MLPerf™ Storage v1.0 AI存储基准测试结果,强调了存储系统在AI模型训练中的重要性。中国AI存储厂商焱融科技在测试中表现突出,其F9000...
蒸馏技术:AI领域的创新与版权争议
2025年1月,OpenAI指控DeepSeek使用其专有模型进行训练,DeepSeek承认使用了“蒸馏”技术。该技术通过提炼大模型的知识来训练小模型,降低计算成本、提升推理速...
DeepSeek-V3:AI模型训练与推理成本的深度解析
本文深入探讨了DeepSeek-V3模型的训练和推理成本,分析了算力需求在AI发展中的重要性,并对比了开源与闭源模型的竞争优势。通过解析多个AI模型和公司的案例,...
1
2