Scaling Law | AI-magic

大模型规模与说服力：Scaling Law的新视角与未来展望

本文探讨了大模型规模与说服力之间的关系，揭示了模型规模增加带来的边际效益递减现象。研究表明，当前前沿模型的单次消息说服力可能已接近天花板，而任务完...

AI快讯

3个月前

Ilya Sutskever在2024年NeurIPS会议上提出，预训练模式已接近极限，并预测未来超级智能系统将具备三个关键特征。他回顾了深度学习的“10层假说”和自回归模型的...

AI快讯

3个月前

谷歌DeepMind团队发布史上最大规模的千亿级视觉语言数据集WebLI-100B，包含1,000亿对图像-文本数据。该数据集验证了数据规模对模型性能的重要性，尤其在文化...

AI快讯

3个月前

特斯拉CEO埃隆·马斯克公开质疑中国AI公司DeepSeek的《大模型训练白皮书》，称其数据造假，并对比OpenAI的GPT-4训练账单。DeepSeek通过全球直播展示其894块A10...

AI快讯

3个月前

本文探讨了Scaling Law在AI推理模型中的应用及其对英伟达的影响。DeepSeek的开源模型R1为AI领域带来新活力，尽管引发市场波动，但英伟达凭借技术积累和生态构...

AI快讯

3个月前

近期围绕Scaling Law的讨论不断，OpenAI的Orion模型能力提升有限，Google的Gemini模型未达预期，Anthropic暂停了Opus 3.5的开发。本文探讨Scaling Law是否失...

AI快讯

3个月前

本文探讨了Scaling Law在人工智能领域的重要性，分析了从模型扩展到大模型算力需求的变化，并展望了AI在未来的应用前景。文章结合OpenAI、DeepSeek等企业的技...

AI快讯

3个月前

本文深入探讨了Grok 3 AI模型的性能，并与其他主流AI模型如Gemini 2.0 Pro、GPT-4o、DeepSeek-V3进行了对比。文章指出Grok 3在数学、科学和代码测试集上的表...

AI快讯

3个月前

本文探讨了DeepSeek如何通过开源和强化学习技术，优化模型架构并降低成本，从而在AI领域掀起一场革命。文章还分析了中美在AI技术发展上的竞争，以及中国在计...

AI快讯

4个月前

本文探讨了大模型在迈向通用人工智能（AGI）中的关键作用，重点介绍了神经符号数据库的创新架构及其在解决数据与算力瓶颈中的潜力。文章还分析了神经符号系统...

AI快讯

4个月前