AI创新 | 第 5 页

DeepEP：开源AI通信库的革命性突破

DeepSeek在“开源周”期间发布了DeepEP，这是一款专为MoE模型训练和推理设计的开源通信库。通过优化全通信、支持NVLink和RDMA、引入FP8等技术，DeepEP显著提升...

AI快讯

2个月前

本文探讨了在NeurIPS 2023上发表的KIAN框架，这是一种创新的知识包容注意网络，结合了知识支持强化学习技术，为AI领域带来了新的突破。文章还涉及其他相关技...

AI快讯

2个月前

DeepSeek作为一款新兴的生成式AI工具，凭借其高效的开源模型和低成本优势，迅速在全球AI市场崭露头角。然而，其数据隐私和安全问题也引发了广泛关注。本文将...

AI快讯

2个月前

斯坦福大学团队提出了一种基于表征的微调新方法ReFT，通过训练干预模块对模型表征进行干预，效果优于现有的大模型参数高效微调方法。这一创新为多租户微调模...

AI快讯

2个月前

2024年AI生成模型领域迎来重大突破，Diffusion Transformer技术成为核心驱动力。从OpenAI的GPT-4.5到Inception的dLLMs，再到阿里巴巴的Wan 2.1，多模态生成和...

AI快讯

2个月前

2024年AI领域在生成模型方面取得了重大进展，MoE架构成为焦点。DeepSeek通过创新的MoE架构和Transformer结合，显著提升了模型的训练效率和性能。文章探讨了Mo...

AI快讯

2个月前

本文探讨了智谱在AI领域的突破性进展，分析了其对中国科技股的影响以及未来产业链的机遇。通过深入解读智谱的技术优势和市场表现，揭示了中国在全球AI竞争中...

AI快讯

2个月前

2024年12月26日，深度求索发布开源大模型DeepSeek V3，其在性能和成本上均优于硅谷顶级大模型，标志着中国AI创新力的崛起。本文探讨了DeepSeek团队的研究能力...

AI快讯

2个月前

本文探讨了Llama 3.1 405B在大模型时代的表现与创新力，分析了其在性能、成本和应用场景上的优势，同时结合中国AI企业DeepSeek的开源策略，展望了全球AI竞争...

AI快讯

2个月前

DeepSeek V3作为中国AI领域的最新成果，以其卓越的性能和低成本优势，成为全球生成AI市场的焦点。本文将深入探讨DeepSeek V3的技术特点、市场影响以及中国AI...

AI快讯

2个月前