标签:大语言模型
Diffusion Transformer:AI生成模型的新里程碑
2024年AI生成模型领域迎来重大突破,Diffusion Transformer技术成为核心驱动力。从OpenAI的GPT-4.5到Inception的dLLMs,再到阿里巴巴的Wan 2.1,多模态生成和...
2024年AI生成模型的新突破与未来展望
2024年AI生成模型领域取得了显著进展,涵盖了大语言模型、图像生成、多模态与智能体等多个方向。OpenAI、Claude等公司在技术发展中扮演了重要角色。本文探讨...
字节对编码(BPE)在大语言模型中的应用与优化
字节对编码(BPE)作为一种高效的子词分割方法,在大语言模型的训练和推理中扮演着关键角色。本文将探讨BPE在生成模型中的应用,以及如何通过优化计算资源和...
2024年AI生成模型的前沿进展与未来展望
2024年AI生成模型领域取得重大突破,涵盖大语言模型、图像生成、多模态与智能体等技术。OpenAI、Claude、xAI等公司推动技术发展,DeepSeek CEO梁文峰强调开源...
大语言模型在自动驾驶中的突破:LeapVAD技术的创新与应用
本文探讨了LeapVAD技术在自动驾驶领域的创新应用,该技术结合大语言模型和视觉语言模型,通过认知感知和Dual-Process思维,实现了更高效的驾驶决策和环境表征...
提示学习框架:大语言模型应用的新引擎
提示学习框架作为大语言模型应用的核心技术,通过优化提示词设计和多模态预训练,显著提升了模型的泛化能力和适应性。本文深入探讨提示学习框架的发展历程、...
Flash Attention:大语言模型中的高效注意力机制
本文深入探讨了Flash Attention技术在大语言模型中的应用,分析了其如何通过IO感知和并行优化显著提升注意力机制的计算效率。文章还结合薛复昭博士的研究经验...
华人博士薛复昭加入Google DeepMind:MoE研究的前沿探索与科研新人的成长指南
本文报道了华人博士薛复昭加入Google DeepMind担任高级研究科学家的消息,并深入探讨了他在混合专家(MoE)领域的研究成果。同时,文章分享了薛复昭对科研新...
Scaling Law:从Google DeepMind新晋华人博士薛复昭的科研之路看技术发展
本文通过Google DeepMind新晋华人博士薛复昭的科研经历,探讨Scaling Law在技术发展中的重要性。文章分享了薛复昭博士对科研新人的七点建议,并深入分析了这...
新晋华人博士薛复昭加入Google DeepMind,分享科研新人七点建议
本文报道了薛复昭博士加入Google DeepMind担任高级研究科学家的消息,并分享了他对科研新人的七点建议,涵盖工程能力、合作、演讲技巧、论文阅读方法等,为科...