标签:AI模型
DeepSeek:AI领域的新星与投资逻辑的变革
DeepSeek作为AI领域的新星,不仅改变了AI产业范式,还引发了科技股投资逻辑的深刻变革。其背后的幻方量化基金凭借强大的资金实力和资源,不依赖外部风险投资...
Figure的谐波方案:人形机器人技术的新突破
本文深入探讨了Figure在人形机器人领域的最新进展,特别是其谐波减速器方案和Helix AI模型的应用。文章还分析了Figure在物流中心和汽车装配线中的实际应用,...
Meta Llama 3:AI模型的新里程碑与行业竞争格局
2024年5月,Meta推出了Llama 3模型,标志着其在AI领域的重要突破。与此同时,Meta计划发布独立Meta AI应用,与OpenAI、谷歌等竞争对手展开激烈角逐。本文探讨...
谷歌Gemini 1.5 Flash模型:AI技术的新里程碑
谷歌最新推出的Gemini 1.5 Flash模型在AI领域引起了广泛关注。这款模型不仅性能卓越,还具备高性价比,为智能应用带来了新的可能性。本文将深入探讨Gemini 1....
DeepSeek-V3:低成本的AI革命与全球AI格局的重塑
本文探讨了DeepSeek-V3如何通过优化旧版本芯片和创新的技术模型,以极低的成本实现与OpenAI GPT系列相媲美的性能。文章分析了DeepSeek-V3的技术原理、对全球A...
MiniMind:低成本、高效率的AI模型训练新标杆
GitHub上的热门项目MiniMind,仅用3块钱和2小时训练出25.8M的超小语言模型,开源了大模型的极简结构和多种算法,拓展了视觉多模态的MiniMind-V,所有核心算法...
深入解析检索增强生成(RAG):从基础到进阶
本文深入探讨检索增强生成(RAG)技术,从基础概念到进阶应用,涵盖模型评估、微调对比及系统优化策略,帮助读者全面理解RAG在AI产品中的应用。
多头潜在注意力机制:深度求索的低成本AI革命
中国人工智能初创企业深度求索通过开源多头潜在注意力机制(MLA)等创新技术,实现了低成本、高性能的AI模型训练和推理。其开源项目FlashMLA和DeepEP在芯片性...
深度求索:低成本高性能AI模型的技术突破与开源贡献
中国人工智能初创企业深度求索通过开源五个AI基础设施项目,包括FlashMLA和DeepEP,展示了其在低成本、高性能模型领域的技术突破。这些项目不仅驳斥了虚报成...
Grok-3与DeepSeek-V3:AI军备竞赛的新篇章
马斯克的Grok-3模型在训练算力消耗上达到DeepSeek-V3的263倍,并在多项基准测试中刷新SOTA,超越其他主流AI模型。这场AI军备竞赛不仅推动了技术进步,也引发...