大语言模型 | 第 15 页

Diffusion Transformer：AI生成模型的新里程碑

2024年AI生成模型领域迎来重大突破，Diffusion Transformer技术成为核心驱动力。从OpenAI的GPT-4.5到Inception的dLLMs，再到阿里巴巴的Wan 2.1，多模态生成和...

AI快讯

2个月前

2024年AI生成模型领域取得了显著进展，涵盖了大语言模型、图像生成、多模态与智能体等多个方向。OpenAI、Claude等公司在技术发展中扮演了重要角色。本文探讨...

AI快讯

2个月前

字节对编码（BPE）作为一种高效的子词分割方法，在大语言模型的训练和推理中扮演着关键角色。本文将探讨BPE在生成模型中的应用，以及如何通过优化计算资源和...

AI快讯

2个月前

2024年AI生成模型领域取得重大突破，涵盖大语言模型、图像生成、多模态与智能体等技术。OpenAI、Claude、xAI等公司推动技术发展，DeepSeek CEO梁文峰强调开源...

AI快讯

2个月前

本文探讨了LeapVAD技术在自动驾驶领域的创新应用，该技术结合大语言模型和视觉语言模型，通过认知感知和Dual-Process思维，实现了更高效的驾驶决策和环境表征...

AI快讯

2个月前

提示学习框架作为大语言模型应用的核心技术，通过优化提示词设计和多模态预训练，显著提升了模型的泛化能力和适应性。本文深入探讨提示学习框架的发展历程、...

AI快讯

2个月前

本文深入探讨了Flash Attention技术在大语言模型中的应用，分析了其如何通过IO感知和并行优化显著提升注意力机制的计算效率。文章还结合薛复昭博士的研究经验...

AI快讯

2个月前

本文报道了华人博士薛复昭加入Google DeepMind担任高级研究科学家的消息，并深入探讨了他在混合专家（MoE）领域的研究成果。同时，文章分享了薛复昭对科研新...

AI快讯

2个月前

本文通过Google DeepMind新晋华人博士薛复昭的科研经历，探讨Scaling Law在技术发展中的重要性。文章分享了薛复昭博士对科研新人的七点建议，并深入分析了这...

AI快讯

2个月前

本文报道了薛复昭博士加入Google DeepMind担任高级研究科学家的消息，并分享了他对科研新人的七点建议，涵盖工程能力、合作、演讲技巧、论文阅读方法等，为科...

AI快讯

2个月前