GPT-4.5：无监督学习扩展的新里程碑，情商与幻觉控制的突破

0 0

GPT-4.5：无监督学习扩展的新里程碑

OpenAI近日发布了GPT-4.5研究预览版，这一新模型在无监督学习扩展技术上取得了显著突破。相较于前代GPT-4，GPT-4.5在情商表现和减少幻觉方面有了显著提升，为人工智能领域注入了新的活力。

情商提升：更自然的对话体验

GPT-4.5在对话理解上更加人性化，能够更好地捕捉用户的微妙情感变化，提供更自然、更温暖的交流体验。OpenAI在内部测试中发现，测试人员更喜欢GPT-4.5的回答，认为其更符合人类的交流习惯。例如，在面对用户表达“考试不及格、很难过”时，GPT-4.5能够提供安慰和鼓励，而GPT-4o的回答则显得较为冰冷。

幻觉控制：SimpleQA测试中的优异表现

GPT-4.5在SimpleQA常识问答测试中表现优异，准确率达到62.5%，幻觉率降至37.1%，相较于前代模型有了显著提升。这一进步主要归功于无监督学习扩展技术，使得模型能够从海量数据中自主学习，减少不准确或无关信息的生成。例如，当用户询问“第一种语言是什么”时，GPT-4.5会诚实回答“这还是人类未解之谜”，而不是随意编造答案。

无监督学习扩展：技术创新的核心

GPT-4.5的核心优势在于其无监督学习扩展技术。通过扩展计算、数据、架构和优化创新，GPT-4.5拥有了更广泛的知识和更深入的世界理解能力。OpenAI在训练过程中采用了低精度训练、跨多个数据中心同时预训练模型等创新方法，显著提升了模型的计算效率。

高昂的API定价：挑战与机遇并存

尽管GPT-4.5在技术上取得了显著突破，但其API定价高昂，输入和输出费用分别为75美元/百万tokens和150美元/百万tokens，相较于GPT-4o高出15-30倍。这一高价策略引发了业内广泛讨论，部分用户认为其性价比有待商榷。然而，GPT-4.5在创造力、视觉理解能力等方面的表现，仍为其赢得了不少忠实用户。