GPT-4.5：OpenAI史上最大規模語言模型的突破與挑戰

0 0

OpenAI於2024年2月28日發布了其最新的大規模語言模型 GPT-4.5，這是基於GPT-4o的進一步升級版本，並被譽為OpenAI史上最大規模的語言模型。GPT-4.5的發布不僅標誌著AI技術的又一次飛躍，也為用戶帶來了更自然、更精準的交互體驗。

技術創新：教師無監督學習與新訓練方法

GPT-4.5的核心技術特點在於其採用了教師無監督學習（Unsupervised Learning）作為主要開發方向。與傳統的“思考鏈”（Chain-of-Thought）方法不同，GPT-4.5通過無監督學習的規模化應用，實現了更廣泛的知識覆蓋和更深層的世界理解。這種方法不僅提升了模型的性能，還大幅降低了幻覺（Hallucination）的發生率。

此外，GPT-4.5引入了一種全新的訓練手法：利用小型模型（如GPT-4o）的數據來訓練更大型的模型。這種“逆向蒸餾”方法突破了傳統的“大模型訓練小模型”模式，從而提升了模型對用戶發言的理解力和會話的自然度。

GPT-4.5：OpenAI史上最大規模語言模型的突破與挑戰

性能提升：幻覺率降低與多語言性能

在性能評估方面，GPT-4.5在多個關鍵指標上取得了顯著進步：

幻覺率降低：在PersonQA測試中，GPT-4.5的幻覺率從GPT-4o的52%大幅降至19%，與GPT-4o的28%相比，精度提升至78%。
多語言性能：GPT-4.5在英語、日語等主要語言中的表現均有提升，例如日語的評分從0.8349升至0.8693。同時，在數據資源較少的語言（如斯瓦希里語和約魯巴語）中也展現了更好的理解與生成能力。

GPT-4.5：OpenAI史上最大規模語言模型的突破與挑戰

安全性評估：謹慎的風險管理

GPT-4.5在安全性方面也進行了全面評估。其對禁止內容的生成回避能力達到了99%，略高於GPT-4o的98%。然而，在良性請求的過度拒絕率（71%）方面，GPT-4.5略遜於GPT-4o（79%）。

特別值得注意的是，GPT-4.5在處理多模態輸入（如文本與圖像）時表現出更高的謹慎性，其“安全輸出回避率”達到了99%，但“過度拒絕率”也上升至31%。這表明GPT-4.5在圖像輸入場景中採取了更為保守的策略。

挑戰與展望：API成本與未來發展

儘管GPT-4.5在技術和性能上取得了顯著突破，但其API使用成本也隨之大幅上升。輸入每百萬token的費用為75美元，輸出則為150美元，這使得GPT-4.5成為OpenAI迄今為止最昂貴的模型之一。OpenAI CEO Sam Altman也在社交媒體上提到，由於GPU資源的限制，GPT-4.5的廣泛推廣面臨挑戰。

展望未來，OpenAI計劃在數月內發布GPT-5，這將進一步改變AI模型的應用格局。在GPT-5的框架下，GPT-4.5將扮演何種角色，仍是一個值得關注的話題。