标签:大型语言模型

大型语言模型的训练与应用:从NVIDIA DGX Cloud到鸿海FoxBrain

本文探讨了大型语言模型(LLM)在训练和应用中的挑战与创新,重点介绍了NVIDIA DGX Cloud在自动化错误归因和高效训练中的技术突破,以及鸿海研究院推出的繁体...

SakanaAI与AI科学家:全自动科学发现的未来

Sakana Lab与牛津大学合作推出的“AI科学家”系统,利用大型语言模型(LLMs)实现全自动科学发现,涵盖从构思研究到撰写论文的整个机器学习研究生命周期。该系...

Meta Llama 1:开创性AI模型的伦理与技术创新

Meta Llama 1作为一款开创性的大型语言模型,凭借其强大的推理和对话能力,推动了人工智能领域的发展。然而,其训练过程中使用的Books3数据集引发了版权纠纷...

从Transformer到DeepSeek-R1:AI语言模型的演进与突破

本文深入探讨了Transformer架构的诞生及其对AI语言模型的深远影响,回顾了从BERT、GPT系列到DeepSeek-R1的演进历程,揭示了AI技术在规模、推理能力和成本效益...

AIOps:智能运维的未来与创新

本文探讨了AIOps在智能运维中的应用,特别是如何通过大型语言模型和生成式AI优化事件管理流程。文章还介绍了Triangle系统的创新框架,展示了其在提高事件处理...

ChatGPT与生成式AI:从技术革命到未来挑战

本文探讨了ChatGPT与生成式AI的技术革命及其在医疗、商业等领域的应用。通过分析AI手术机器人的模仿学习技术,结合大型语言模型的发展,揭示了AI在解决复杂问...

Transformer架构的革新:从Google到Midjourney的AI进化之路

本文探讨了Transformer架构的诞生及其对现代AI模型的深远影响,尤其是其在生成式AI领域如Midjourney的应用。文章还深入分析了Google在大型语言模型中的早期贡...

NVIDIA生成式人工智能服务:驱动未来创新与增长

NVIDIA在2024年第四季度财报电话会议中总结了10个主要信息点,强调了公司在生成式人工智能、大型语言模型、数据中心基础设施和加速计算领域的显著增长和创新...

生成式人工智能的崛起:NVIDIA与研华的创新实践

本文探讨了生成式人工智能的最新发展,重点介绍了NVIDIA和研华科技在这一领域的创新实践。文章涵盖了NVIDIA在生成式AI领域的显著增长、研华科技的边缘AI系统...

大型语言模型的革命性演进:从Transformer到DeepSeek-R1

本文回顾了大型语言模型(LLMs)从2017年Transformer架构的引入到2025年DeepSeek-R1的革命性发展历程。文章探讨了LLMs在语言理解、生成能力、推理任务等方面...
1 2 3 4 5