OpenAI於2024年2月28日發布了其最新的大規模語言模型GPT-4.5,這是基於GPT-4o的進一步升級版本,並被譽為OpenAI史上最大規模的語言模型。GPT-4.5的發布不僅標誌著AI技術的又一次飛躍,也為用戶帶來了更自然、更精準的交互體驗。
技術創新:教師無監督學習與新訓練方法
GPT-4.5的核心技術特點在於其採用了教師無監督學習(Unsupervised Learning)作為主要開發方向。與傳統的“思考鏈”(Chain-of-Thought)方法不同,GPT-4.5通過無監督學習的規模化應用,實現了更廣泛的知識覆蓋和更深層的世界理解。這種方法不僅提升了模型的性能,還大幅降低了幻覺(Hallucination)的發生率。
此外,GPT-4.5引入了一種全新的訓練手法:利用小型模型(如GPT-4o)的數據來訓練更大型的模型。這種“逆向蒸餾”方法突破了傳統的“大模型訓練小模型”模式,從而提升了模型對用戶發言的理解力和會話的自然度。
性能提升:幻覺率降低與多語言性能
在性能評估方面,GPT-4.5在多個關鍵指標上取得了顯著進步:
-
幻覺率降低:在PersonQA測試中,GPT-4.5的幻覺率從GPT-4o的52%大幅降至19%,與GPT-4o的28%相比,精度提升至78%。
-
多語言性能:GPT-4.5在英語、日語等主要語言中的表現均有提升,例如日語的評分從0.8349升至0.8693。同時,在數據資源較少的語言(如斯瓦希里語和約魯巴語)中也展現了更好的理解與生成能力。
安全性評估:謹慎的風險管理
GPT-4.5在安全性方面也進行了全面評估。其對禁止內容的生成回避能力達到了99%,略高於GPT-4o的98%。然而,在良性請求的過度拒絕率(71%)方面,GPT-4.5略遜於GPT-4o(79%)。
特別值得注意的是,GPT-4.5在處理多模態輸入(如文本與圖像)時表現出更高的謹慎性,其“安全輸出回避率”達到了99%,但“過度拒絕率”也上升至31%。這表明GPT-4.5在圖像輸入場景中採取了更為保守的策略。
挑戰與展望:API成本與未來發展
儘管GPT-4.5在技術和性能上取得了顯著突破,但其API使用成本也隨之大幅上升。輸入每百萬token的費用為75美元,輸出則為150美元,這使得GPT-4.5成為OpenAI迄今為止最昂貴的模型之一。OpenAI CEO Sam Altman也在社交媒體上提到,由於GPU資源的限制,GPT-4.5的廣泛推廣面臨挑戰。
展望未來,OpenAI計劃在數月內發布GPT-5,這將進一步改變AI模型的應用格局。在GPT-5的框架下,GPT-4.5將扮演何種角色,仍是一個值得關注的話題。
總結
GPT-4.5的發布展示了OpenAI在大規模語言模型領域的持續創新能力。通過教師無監督學習和全新的訓練方法,GPT-4.5在多語言理解、幻覺率降低和安全性方面取得了顯著進步。然而,高額的API成本和資源限制也為其推廣帶來了挑戰。隨著GPT-5的即將發布,AI技術的未來發展將更加令人期待。