大语言模型 | 第 17 页

Transformer技术革新：从SOTA翻译到生成AI的未来

本文深入探讨Transformer技术在SOTA翻译中的应用，并扩展到其在生成AI领域的创新。文章涵盖Transformer的核心机制、最新模型发展以及生成AI的实践案例，展现...

AI快讯

4个月前

本文探讨了大语言模型（LLM）的技术革新，包括长期记忆、定制化模型开发及其在业务中的应用，同时分析了LLM面临的挑战与未来发展方向。

AI快讯

4个月前

本文探讨了DeepSeek创始人梁文锋的职业生涯及其在AI领域的贡献，重点介绍了DeepSeek-V3大语言模型的创新技术及其行业影响。文章还分析了稀疏注意力机制（NSA...

AI快讯

4个月前

本文探讨了DeepSeek-R1在多头注意力机制（MHA）到多头潜在注意力（MLA）迁移中的创新技术，详细介绍了MHA2MLA微调方法及其在降低计算成本和内存占用方面的显...

AI快讯

4个月前

NVIDIA自动驾驶实验室与斯坦福大学合作，利用生成式AI技术和大语言模型开发了一种创新算法，能够实时检测并响应突发异常，展现零样本泛化能力，显著提升自动...

AI快讯

4个月前

本文探讨了零样本泛化在AI领域的最新进展，涵盖了生成式AI、大语言模型和强化学习等技术在自动驾驶、游戏和机器人领域的应用，展示了其在不同场景中的强大能力。

AI快讯

4个月前

本文探讨了大语言模型（LLM）和生成式AI在自动驾驶领域的应用，特别是NVIDIA与斯坦福大学合作开发的算法如何通过实时检测和响应突发异常来增强自动驾驶系统的...

AI快讯

4个月前

Organa是一款由多伦多大学研究人员开发的台式机器人系统，利用大语言模型（LLM）和计算机视觉技术，将科学家的口头指令转化为化学实验流程，推动实验室自动化...

AI快讯

4个月前

Organa 是一款由多伦多大学开发的台式机器人系统，结合计算机视觉和大语言模型，能够自动化处理化学实验室任务，将科学家的口头指令转化为实验流程，并实时监...

AI快讯

4个月前