标签:AI创新

DeepEP:开源AI通信库的革命性突破

DeepSeek在“开源周”期间发布了DeepEP,这是一款专为MoE模型训练和推理设计的开源通信库。通过优化全通信、支持NVLink和RDMA、引入FP8等技术,DeepEP显著提升...

KIAN:知识包容注意网络在AI中的创新应用

本文探讨了在NeurIPS 2023上发表的KIAN框架,这是一种创新的知识包容注意网络,结合了知识支持强化学习技术,为AI领域带来了新的突破。文章还涉及其他相关技...

DeepSeek:生成式AI的新星与全球AI格局的变革

DeepSeek作为一款新兴的生成式AI工具,凭借其高效的开源模型和低成本优势,迅速在全球AI市场崭露头角。然而,其数据隐私和安全问题也引发了广泛关注。本文将...

斯坦福大学提出ReFT:大语言模型表征微调的新突破

斯坦福大学团队提出了一种基于表征的微调新方法ReFT,通过训练干预模块对模型表征进行干预,效果优于现有的大模型参数高效微调方法。这一创新为多租户微调模...

Diffusion Transformer:AI生成模型的新里程碑

2024年AI生成模型领域迎来重大突破,Diffusion Transformer技术成为核心驱动力。从OpenAI的GPT-4.5到Inception的dLLMs,再到阿里巴巴的Wan 2.1,多模态生成和...

MoE架构:AI领域的革命性创新与DeepSeek的突破

2024年AI领域在生成模型方面取得了重大进展,MoE架构成为焦点。DeepSeek通过创新的MoE架构和Transformer结合,显著提升了模型的训练效率和性能。文章探讨了Mo...

智谱引领AI创新:中国科技股的崛起与未来机遇

本文探讨了智谱在AI领域的突破性进展,分析了其对中国科技股的影响以及未来产业链的机遇。通过深入解读智谱的技术优势和市场表现,揭示了中国在全球AI竞争中...

深度求索DeepSeek V3:中国AI创新力的崛起与全球竞争新格局

2024年12月26日,深度求索发布开源大模型DeepSeek V3,其在性能和成本上均优于硅谷顶级大模型,标志着中国AI创新力的崛起。本文探讨了DeepSeek团队的研究能力...

Llama 3.1 405B:大模型时代的性能与创新力

本文探讨了Llama 3.1 405B在大模型时代的表现与创新力,分析了其在性能、成本和应用场景上的优势,同时结合中国AI企业DeepSeek的开源策略,展望了全球AI竞争...

DeepSeek V3:中国AI创新的里程碑

DeepSeek V3作为中国AI领域的最新成果,以其卓越的性能和低成本优势,成为全球生成AI市场的焦点。本文将深入探讨DeepSeek V3的技术特点、市场影响以及中国AI...
1 3 4 5 6