
OpenAI 又推出新的模型了!這次推出兩款新模型 GPT-o3 和 GPT-o4-mini,不只在推理能力上全面升級,更首度整合了 搜尋、Python、圖像分析與生成工具,不只更聰明,還能更「主動」幫你解決複雜問題。
不過你可能會想問:「既然已經有 GPT-4o,那麼 o3、o4-mini 又是什麼?這些名字到底有什麼差別?」我們這篇文章就幫你一次搞懂:新模型 o3 和 o4-mini 到底多強?跟舊版本差在哪?對一般使用者又有什麼實際幫助?
o3 和 o4-mini 有什麼新功能?
根據 OpenAI 官方說明,GPT-o3 是目前 OpenAI 最聰明的模型,在程式、數學、視覺分析等領域表現最佳,甚至能自己判斷何時該使用工具(像是網頁搜尋或 Python)。
o3、o4-mini 都能整合 ChatGPT 的內建工具,包括:
- 即時搜尋網路資料
- 使用 Python 做分析或繪圖
- 解讀與生成圖片
這代表,使用者只要提出一個問題,模型可以自行決定先搜尋資料、再跑程式、最後畫圖解釋,變成一個會自己動手做事的 AI 助理!
例如你可以上傳一張圖片,即便看不太清楚,GPT-o3 也可以幫你解析,然後試著用不同的角度去思考你可能想要知道些什麼,並且在必要的時候直接搜尋和這張圖片的相關資訊。

新舊版 ChatGPT 差在哪裡?
主動性有差
直接給大家一個最直接的舉例,同樣用上面那張雕像的照片當作例子。
舊版 GPT-4o
我把相同的照片、描述文字(這個雕像好特別)丟給 GPT-4o 的模型,結果會是這樣。

雖然同樣會帶出雕像的資訊,但因為不會主動連網搜尋(其實 4o 也會,但是主動性不高),所以帶出來的資訊可能會是過時的。
新版 GPT-o3
而新的 GPT-o3 模型則會主動查找相關的資訊,你可以看到每一個資訊旁邊都會註明出處,讓你知道這些資訊都是從哪裡來的。
此外,GPT-o3 還會思考,想說你可能會想要親臨現場看一看,所以提供交通資訊、位置、門票價格給你。

我自己覺得最大的差異,是舊版的 GPT 模型通常就是你一個口令他一個動作,但是新版的 GPT-o3 或是 o4-mini 會先考慮你可能的需求,然後一口氣把可以呈現的資料都呈現出來,減少一來一回的時間,算是蠻不錯的。
正確度更高
搭配搜尋、圖像辨識的功能,新版的 GPT-o3 回答正確度也真的大幅提高。
舊版 GPT-4o
下面這張圖是我之前請 GPT-4o 幫我看看這個工地玩具有沒有包含車輛在內?還是只有場景?GPT-4o 給我的回答是:

新版 GPT-o3
同樣的內容我丟給 GPT-o3 呢?他會先分析我的問題,然後開始掃描圖片。

甚至還會把可能有線索的地方特別放大來重點掃描。


最後他非常肯定的跟我說「沒有」!所以相較 GPT-4o 來說,GPT-o3 的穩定度和正確率都高出不少。
GPT-4o、GPT-o1、GPT-o3、GPT-o4-mini 差異比較
雖然 GPT-4o 也是很強的「全方位模型」,但 o3 和 o4-mini 是專門針對「推理任務」優化,且首次全面整合工具能力。
| 適合場景 | 特色 | 整合工具 | |
| GPT-4o | 一般聊天、翻譯、語音互動 | 速度快、支援語音與視訊 | 有限 |
| GPT-o1 | 簡單推理任務 | 過往的基本推理模型 | 無 |
| GPT-o3 | 進階推理、圖像/程式分析 | 推理力最強、支援所有工具 | 有 |
| GPT-o4-mini | 快速回答、效能優先 | 推理力不輸大模型,省資源 | 有 |
此外,很多人應該對於 GPT 模型的命名感到困惑,其實很簡單。
你可以把 O 開頭的想像成是「Operations」,和工具有關的,所以想是要使用搜尋、推理、整合….等等的,O 開頭系列的會比較厲害。
付費帳號已經可以使用
只要你是 ChatGPT Plus 或 Team 用戶,現在就可以切換到 o3 或 o4-mini 模型來使用。
最後也總結一下 o3、o4-mini 重點:
- 整合搜尋、Python、圖像生成工具
- 會思考「該不該用工具」來幫你回答問題
- 推理能力與過往模型差距非常明顯
- 操作更自然、更像對話
- 效能更高、使用成本更低
延伸閱讀》
如果想知道更多關於 Apple 的消息、教學、小技巧或是科技新知,一定要點擊以下任一 LOGO,追蹤我們的 Facebook 粉絲團、訂閱 IG、YouTube 以及 Telegram。
















