OpenAI近日发布了其最新的大模型GPT-4.5,这一模型在计算效率上较GPT-4提升了超过10倍,并且具备更广泛的知识库和更强的“情商”。然而,GPT-4.5的成本是GPT-4o的30倍,且不具备争夺“宇宙最强大模型”的实力。OpenAI正在评估是否长期在API中继续提供该模型,并强调其在高情商和创造力方面的表现。
高成本与高情商
GPT-4.5的发布引起了广泛关注,但其高昂的成本也成为了讨论的焦点。根据OpenAI的定价,GPT-4.5的输入和输出费用分别为每百万token 75美元和150美元,相比之下,GPT-4o的输入和输出费用仅为2.50美元和10美元。尽管成本高昂,GPT-4.5在创造力和高情商对话方面的表现却令人印象深刻。
知识库与创造力
GPT-4.5在知识库和创造力方面表现出色。在OpenAI开发的SimpleQA测试中,GPT-4.5的得分为62.5%,远高于GPT-4o的38.6%和o3-mini的15%。此外,GPT-4.5在减少“幻觉”(即模型生成虚构内容)方面也有显著改进,其幻觉率仅为37.1%,而GPT-4o和o3-mini的幻觉率分别为59.8%和80.3%。
高情商对话
GPT-4.5的另一个亮点是其高情商的对话能力。OpenAI的测试人员表示,在日常查询、专业查询和创造性任务中,他们更倾向于使用GPT-4.5。例如,当用户表示自己正在经历困难时,GPT-4.5会提供同情和支持,而GPT-4o则可能直接给出解决方案列表。这种高情商的对话能力使得GPT-4.5在用户体验上更具优势。
未来的挑战与展望
尽管GPT-4.5在多个方面表现出色,但其高昂的成本和有限的计算效率仍然是其面临的挑战。OpenAI表示,他们正在评估是否长期在API中继续提供该模型,并强调其在创造力和高情商对话方面的表现。未来,OpenAI可能会更加注重模型的效率和特定问题的解决能力,而不仅仅是追求模型的规模和计算能力。
GPT-4.5的发布标志着OpenAI在AI模型开发上的新一步,尽管其成本和效率问题仍有待解决,但其在创造力和高情商对话方面的表现无疑为用户带来了新的体验。