大语言模型的现状与质疑
近年来,大语言模型(LLMs)如GPT系列、DeepSeek等在自然语言处理领域取得了显著进展,甚至在某些任务中表现出了接近人类的能力。然而,图灵奖得主杨立昆对这些模型的未来持怀疑态度。他在最近的演讲中直言,LLMs无法达到通用人工智能(AGI),并提出了联合嵌入预测架构(JEPA)作为实现人类水平智能的新范式。
杨立昆的观点并非孤立。朱松纯教授在其新书《为机器立心》中也指出,当前的大模型更像是“缸中之脑”,缺乏与现实世界的实质性联结。这种符号落地(symbol grounding)问题使得大模型在理解真实世界时存在根本性缺陷。例如,GPT-4在处理简单的数学题或事实性任务时,常常表现出“知识幻象”,无法真正掌握概念。
符号落地与推理模型的突破
符号落地问题是大模型无法实现AGI的核心障碍之一。朱松纯教授指出,大模型通过统计建模学习文本之间的语言学关系,但缺乏从“词语”到“世界”的联结。这种局限性使得大模型在复杂推理任务中表现不佳,甚至陷入无限循环的对话。
然而,DeepSeek的R1模型在这一领域取得了突破。通过纯强化学习,R1证明了即使没有过程监督,仅通过结果监督也能实现顶级推理模型的性能。这一创新不仅降低了推理模型的开发门槛,还为大模型的符号落地问题提供了新的解决思路。R1的成功表明,模型可以通过自主学习生成复杂的推理路径,而无需依赖人类标注的过程数据。
视觉学习与AI的未来
杨立昆在演讲中还强调了视觉学习的重要性。他认为,视觉信息是人类智能的核心组成部分,未来5-7年内,视觉学习可能会取得重大突破,甚至有望在10年内实现人类级智能。这一观点与朱松纯教授提出的“知行合一”理念不谋而合。朱松纯指出,大模型在符号数据难以表达的任务(如炒菜、驾驶)中表现不佳,而视觉学习可以为这些任务提供更直观的解决方案。
推理模型的社会影响
DeepSeek的R1不仅在技术上取得了突破,还对社会产生了深远影响。R1的推理能力不仅限于数学和编程,还可以应用于语言生成和风格模仿。例如,R1在古典诗歌创作和鲁迅风格模仿中的表现,让普通用户也能体验到AI的创造力。这种能力的普及不仅提升了大众对AI的认知,也为AI在文化领域的应用开辟了新的可能性。
结论:大语言模型的未来之路
尽管大语言模型在自然语言处理领域取得了显著进展,但其在实现通用人工智能的道路上仍面临诸多挑战。符号落地问题、推理能力的局限以及视觉学习的不足,都是当前模型需要突破的关键点。然而,DeepSeek的R1模型和杨立昆提出的JEPA架构,为AI的未来提供了新的方向。未来5-10年,随着视觉学习和推理模型的进一步发展,我们有望看到更接近人类水平的智能系统出现。
大语言模型的未来,不仅依赖于技术的创新,还需要我们对智能本质的深入理解。正如朱松纯教授所言,为机器立“心”,才是实现AGI的关键。