GPT-4.5:情商提升背后的AI进化与挑战

AI快讯2个月前发布 admin
0 0

GPT-4.5:情商提升背后的AI进化与挑战

GPT-4.5的发布:情商与知识的双重进化

OpenAI近日发布了GPT-4.5研究预览版,这一版本在情商表现和减少幻觉方面取得了显著提升。相较于GPT-4,GPT-4.5更像一个善解人意的朋友,能够理解用户的言外之意,捕捉微妙的情感变化。OpenAI在内部测试中发现,测试人员更喜欢GPT-4.5的回答,认为它更自然、更温暖、更符合人类的交流习惯。

SimpleQA常识问答测试中,GPT-4.5的幻觉比例大幅下降,准确率达到62.5%,遥遥领先于OpenAI其他模型。此外,GPT-4.5在PersonQA数据集上取得了0.78的准确率,优于GPT-4o和o1。这些数据表明,GPT-4.5在知识广度和理解用户意图方面有了显著提升。

GPT-4.5:情商提升背后的AI进化与挑战

GPT-4.5:情商提升背后的AI进化与挑战

无监督学习:GPT-4.5的核心技术

GPT-4.5的突破很大程度上归功于“无监督学习”的进步。无监督学习让AI自己从海量数据中学习,而不是靠人工标注数据。这种学习方式使得GPT-4.5的知识面更广,对用户意图的理解更精准,情绪智能也有所提升。OpenAI认为,无监督学习和推理能力是AI发展的两大支柱。

在训练机制上,OpenAI通过多次迭代,结合了监督式微调和基于人类反馈的强化学习来完成后训练过程,最终开发出了可以部署的模型。这种新的训练机制能够使用更小的计算资源来微调如此大型的模型,从而实现了无监督学习的大规模扩展。

GPT-4.5:情商提升背后的AI进化与挑战

GPT-4.5:情商提升背后的AI进化与挑战

高昂的API定价与推理成本

尽管GPT-4.5在情商和知识表现上取得了显著进步,但其高昂的API定价和推理成本引发了争议。GPT-4.5的计算量极大,成本高昂,因此并不会取代GPT-4o。OpenAI仍在评估是否长期在API中提供GPT-4.5,以便在支持当前功能的同时,继续推进未来模型的开发。

在编程和软件工程方面,GPT-4.5的代码生成和修复任务表现有所提升,但其性价比并不高。创立AI公司的Enrico表示,除非你愿意做“冤大头”或“人傻钱多”,否则在编程中不要使用GPT-4.5。

行业反应与未来展望

GPT-4.5的发布引发了行业的广泛讨论。纽约大学教授马库斯直接发长文痛批GPT-4.5是个“空心汉堡”,认为OpenAI已经彻底失去了护城河。与此同时,国内DeepSeek连续6天给人们带来了开源暴击,R1模型直接减价75%。

尽管面临高价策略的挑战,GPT-4.5仍为行业注入新活力,其引入的“无监督学习扩展”技术或为未来大模型发展提供新思路。OpenAI首席研究官Mark Chen表示,GPT-4.5的发布正是说明模型在规模上的Scaling还没达到极限,未来将继续推进推理能力的进展。

总结

GPT-4.5在情商表现和减少幻觉方面取得了显著进步,但高昂的API定价和推理成本仍是其面临的挑战。通过“无监督学习扩展”技术,GPT-4.5为AI行业注入新活力,或为未来大模型发展提供新思路。尽管行业反应不一,GPT-4.5的发布无疑为AI进化迈出了重要一步。

© 版权声明

相关文章

暂无评论

暂无评论...