面對 Claude、Google Gemini 的強勢襲來,OpenAI 日前也發布全新 GPT-5.2 模型回擊;GPT-5.2 除了進一步提升整體性能、增強專業知識能力外,也有針對不同使用場景最佳化,目標是讓 ChatGPT 更適合專業工作(例如程式、法律、金融、科學研究),同時降低錯誤(幻覺)並提升推理能力。
目前 GPT-5.2 已向付費用戶逐步開放使用,同時也有保留舊版 GPT-5.1 系列模型供用戶選擇;而免費用戶則要再等等。

GPT-5.2 同樣有 3 種變體,幫助用戶提升工作效率
GPT‑5.2 模型是 GPT‑5 架構的第一次重大更新,屬於 GPT-5 的進階版本;知識截止日期更新到 2025 年 8 月底,並在推理、準確性、工具使用和多模態(文字+圖片)能力上全面升級。
OpenAI 特別強調,GPT‑5.2 是在內部「code red」緊急狀態下加速開發的成果,目的是快速回應 Google Gemini 3 等競爭對手的進步,維持在生成式 AI 領域的領先地位。

GPT-5.2 同樣有三種變體,用戶可依照自身需求選擇使用:
GPT‑5.2 Instant
GPT‑5.2 Thinking
「深度思考」版本,專為複雜任務設計,例如寫程式碼、分析長文件、解數學題、做策略規劃、處理多步驟專案;在 OpenAI 內部的「GDPval」專業能力基準測試中,GPT‑5.2 Thinking 在超過 70% 的任務上表現優於人類專業人士,而且完成速度比人類快 11 倍。
GPT‑5.2 Pro
最高階的 GPT-5.2 變體,強調極高的準確性與可靠性,適合對錯誤容忍度極低的專業場景,例如:法律文件審查、金融分析、醫療研究支援等。
GPT-5.2 的五大改進
幻覺更少
GPT‑5.2 模型的幻覺(編造事實、引用不存在的資料)相比 GPT-5.1 減少約 38%,輸出資料更可信、更結構化。

支援更長的上下文
支援長達 400,000 個 token 的上下文,代表可以同時處理數百頁的文件、多份合約或大型程式碼庫,並保持高度的一致性與準確性。
OpenAI 也表示在需要整合跨越數十萬 Token 的資訊,並進行深度文件分析時,GPT‑5.2 Thinking 的準確度遠高於 GPT‑5.1 Thinking;GPT‑5.2 Thinking 甚至是首個在 4-needle MRCR 測試中達到幾乎 100% 準確度的模型。

視覺分析能力更強
GPT‑5.2 Thinking 也有強化視覺分析能力,在圖表推理及軟體介面理解方面的錯誤率減少約 50%;能更準確理解資訊主頁、產品螢幕截圖、技術圖表和視覺報告,支援金融、營運、工程、設計和客戶支援等高度依賴視覺資訊的工作流程。


更強的推理與規劃能力
在數學、科學、邏輯推理和多步驟問題解決上表現顯著提升,特別適合研究、工程和策略分析;在 GPQA Diamond 這個研究生級別、防止依靠 Google 搜尋的科學問答基準測試中,GPT‑5.2 Pro 取得 93.2% 的準確率,GPT‑5.2 Thinking 則達到 92.4%。
而在在 FrontierMath(第 1 至 3 級)的專家級數學評估中,GPT‑5.2 Thinking 創下新紀錄,成功解答 40.3% 的題目。

多模態與工具整合更穩定可靠
支援文字與圖片輸入(多模態),能分析圖表、截圖、手寫筆記等,並能使用外部工具(如搜尋、計算、資料庫、API),自動完成複雜工作流,同時也更可靠。
GPT-5.2 多項測試完勝 Claude Opus 4.5、Gemini 3 Pro
畢竟是 OpenAI 最新的旗艦模型,GPT-5.2 也在多項測試中完勝 Claude Opus 4.5、Gemini 3 Pro,重返最強 AI 寶座;特別是在「軟體工程」、「抽象推理」、「知識工作任務」這幾類差距最明顯。
不過有趣的是,FrontierMath(高階數學)在不同難度層級的結果,GPT-5.2 在 Tier 1–3 為 40.3% 居冠,但在最難的 Tier 4,Gemini 反而以 18.8% 超車 GPT-5.2 的 14.6%,顯示不同模型在特定題型仍可能各有強項。

GPT-5.2 已逐步開放付費用戶使用,迪士尼也將合作 OpenAI
即日起,ChatGPT Plus、Pro、Business 和 Enterprise 方案的付費用戶,可以逐步切換到 GPT‑5.2 的不同版本(Instant / Thinking / Pro)使用,而舊版的 GPT-5.1 模型也有持續保留;不過免費用戶還得再等等。

除此之外,迪士尼也宣布將投資 10 億美元與 OpenAI 進行為期三年的戰略合作,並授權 Star Wars、漫威等系列在內的 200 多名角色用於 OpenAI 的 Sora 影片生成工具,顯示 OpenAI 正在強化娛樂與創意內容領域的布局。
延伸閱讀》
如果想知道更多關於 Apple 的消息、教學、小技巧或是科技新知,一定要點擊以下任一 LOGO,追蹤我們的 Facebook 粉絲團、訂閱 IG、YouTube 以及 Telegram。




























