大语言模型的未来：质疑与突破

0 0

大语言模型的未来：质疑与突破

大语言模型的现状与质疑

近年来，大语言模型（LLMs）如GPT系列、DeepSeek等在自然语言处理领域取得了显著进展，甚至在某些任务中表现出了接近人类的能力。然而，图灵奖得主杨立昆对这些模型的未来持怀疑态度。他在最近的演讲中直言，LLMs无法达到通用人工智能（AGI），并提出了联合嵌入预测架构（JEPA）作为实现人类水平智能的新范式。

杨立昆的观点并非孤立。朱松纯教授在其新书《为机器立心》中也指出，当前的大模型更像是“缸中之脑”，缺乏与现实世界的实质性联结。这种符号落地（symbol grounding）问题使得大模型在理解真实世界时存在根本性缺陷。例如，GPT-4在处理简单的数学题或事实性任务时，常常表现出“知识幻象”，无法真正掌握概念。

大语言模型的未来：质疑与突破

符号落地与推理模型的突破

符号落地问题是大模型无法实现AGI的核心障碍之一。朱松纯教授指出，大模型通过统计建模学习文本之间的语言学关系，但缺乏从“词语”到“世界”的联结。这种局限性使得大模型在复杂推理任务中表现不佳，甚至陷入无限循环的对话。

然而，DeepSeek的R1模型在这一领域取得了突破。通过纯强化学习，R1证明了即使没有过程监督，仅通过结果监督也能实现顶级推理模型的性能。这一创新不仅降低了推理模型的开发门槛，还为大模型的符号落地问题提供了新的解决思路。R1的成功表明，模型可以通过自主学习生成复杂的推理路径，而无需依赖人类标注的过程数据。

大语言模型的未来：质疑与突破

视觉学习与AI的未来

杨立昆在演讲中还强调了视觉学习的重要性。他认为，视觉信息是人类智能的核心组成部分，未来5-7年内，视觉学习可能会取得重大突破，甚至有望在10年内实现人类级智能。这一观点与朱松纯教授提出的“知行合一”理念不谋而合。朱松纯指出，大模型在符号数据难以表达的任务（如炒菜、驾驶）中表现不佳，而视觉学习可以为这些任务提供更直观的解决方案。

推理模型的社会影响

DeepSeek的R1不仅在技术上取得了突破，还对社会产生了深远影响。R1的推理能力不仅限于数学和编程，还可以应用于语言生成和风格模仿。例如，R1在古典诗歌创作和鲁迅风格模仿中的表现，让普通用户也能体验到AI的创造力。这种能力的普及不仅提升了大众对AI的认知，也为AI在文化领域的应用开辟了新的可能性。

结论：大语言模型的未来之路

尽管大语言模型在自然语言处理领域取得了显著进展，但其在实现通用人工智能的道路上仍面临诸多挑战。符号落地问题、推理能力的局限以及视觉学习的不足，都是当前模型需要突破的关键点。然而，DeepSeek的R1模型和杨立昆提出的JEPA架构，为AI的未来提供了新的方向。未来5-10年，随着视觉学习和推理模型的进一步发展，我们有望看到更接近人类水平的智能系统出现。

大语言模型的未来，不仅依赖于技术的创新，还需要我们对智能本质的深入理解。正如朱松纯教授所言，为机器立“心”，才是实现AGI的关键。