GPT-4.5：人工智能的新高峰与挑战

0 0

2025年2月27日，OpenAI正式发布了其最新的人工智能模型GPT-4.5。这一模型在多个领域展现了显著的进步，尤其是在情商、事实性问答和软件开发能力方面。然而，随着性能的提升，GPT-4.5也面临着一系列挑战，包括高昂的运行成本和推理能力的不足。

GPT-4.5：人工智能的新高峰与挑战

GPT-4.5的核心优势

GPT-4.5在多个基准测试中表现优异，尤其是在事实性问答和软件开发领域。根据OpenAI的官方数据，GPT-4.5在“SimpleQA”基准测试中的准确率达到了62.5%，相比前代GPT-4o的38.2%有了显著提升。同时，其幻觉率（即生成虚假信息的概率）从61.8%大幅降低至37.1%，显示出更高的可靠性和准确性。

在情商方面，GPT-4.5展现了更贴近人类情感和交流习惯的能力。例如，在处理用户关于“工作与家庭平衡”的咨询时，GPT-4.5能够更自然地引导对话，并提供更具同理心的建议。这种能力使其在文章创作、设计支持等创意领域具有广泛的应用潜力。

GPT-4.5：人工智能的新高峰与挑战

推理能力的局限

尽管GPT-4.5在知识量和情商方面表现出色，但其推理能力仍显不足。与OpenAI的推论模型o3-mini相比，GPT-4.5在需要复杂思考的科学和数学问题上表现较弱。例如，在AIME（美国数学邀请赛）的基准测试中，GPT-4.5的得分仅为36.7%，远低于o3-mini的87.3%。这表明GPT-4.5更擅长基于知识的任务，而非需要深度推理的复杂问题。

GPT-4.5：人工智能的新高峰与挑战

高昂的运行成本

GPT-4.5的巨大规模带来了显著的计算资源需求，其API使用成本高达GPT-4o的30倍。输入和输出的费用分别为每百万tokens 75美元和150美元，这使得许多开发者对其望而却步。此外，GPT-4.5的生成速度也较慢，例如在生成SVG代码时，GPT-4.5需要36秒，而GPT-4o仅需25秒。

未来的发展方向

OpenAI的CEO Sam Altman表示，GPT-4.5是“Chain-of-Thought”推论模型之前的最后一个非推论模型。未来，OpenAI计划将推论与非推论模型的优势结合，推出更具综合能力的GPT-5。尽管GPT-4.5在创意领域和知识性任务中表现出色，但其高昂的成本和推理能力的局限使其难以在广泛的应用场景中普及。