GPT-o3 / o4-mini 模型推出！實測整合搜尋、圖像辨識與推理真的更好用

最後更新： 2025 年 4 月 21 日

OpenAI 又推出新的模型了！這次推出兩款新模型 GPT-o3 和 GPT-o4-mini，不只在推理能力上全面升級，更首度整合了搜尋、Python、圖像分析與生成工具，不只更聰明，還能更「主動」幫你解決複雜問題。

不過你可能會想問：「既然已經有 GPT-4o，那麼 o3、o4-mini 又是什麼？這些名字到底有什麼差別？」我們這篇文章就幫你一次搞懂：新模型 o3 和 o4-mini 到底多強？跟舊版本差在哪？對一般使用者又有什麼實際幫助？

o3 和 o4-mini 有什麼新功能？

根據 OpenAI 官方說明，GPT-o3 是目前 OpenAI 最聰明的模型，在程式、數學、視覺分析等領域表現最佳，甚至能自己判斷何時該使用工具（像是網頁搜尋或 Python）。

o3、o4-mini 都能整合 ChatGPT 的內建工具，包括：

這代表，使用者只要提出一個問題，模型可以自行決定先搜尋資料、再跑程式、最後畫圖解釋，變成一個會自己動手做事的 AI 助理！

例如你可以上傳一張圖片，即便看不太清楚，GPT-o3 也可以幫你解析，然後試著用不同的角度去思考你可能想要知道些什麼，並且在必要的時候直接搜尋和這張圖片的相關資訊。

ChatGPT o3 o4-mini 模型 OpenAI

上面的圖片你可以看到，我只是跟他說這個雕像好特別，他就會自動幫我辨識圖像內容，然後搜尋和這個雕像相關的資訊。

直接給大家一個最直接的舉例，同樣用上面那張雕像的照片當作例子。

舊版 GPT-4o

我把相同的照片、描述文字（這個雕像好特別）丟給 GPT-4o 的模型，結果會是這樣。

ChatGPT o3 o4-mini 模型 OpenAI

雖然同樣會帶出雕像的資訊，但因為不會主動連網搜尋（其實 4o 也會，但是主動性不高），所以帶出來的資訊可能會是過時的。

新版 GPT-o3

而新的 GPT-o3 模型則會主動查找相關的資訊，你可以看到每一個資訊旁邊都會註明出處，讓你知道這些資訊都是從哪裡來的。

此外，GPT-o3 還會思考，想說你可能會想要親臨現場看一看，所以提供交通資訊、位置、門票價格給你。

ChatGPT o3 o4-mini 模型 OpenAI

我自己覺得最大的差異，是舊版的 GPT 模型通常就是你一個口令他一個動作，但是新版的 GPT-o3 或是 o4-mini 會先考慮你可能的需求，然後一口氣把可以呈現的資料都呈現出來，減少一來一回的時間，算是蠻不錯的。

搭配搜尋、圖像辨識的功能，新版的 GPT-o3 回答正確度也真的大幅提高。

舊版 GPT-4o

下面這張圖是我之前請 GPT-4o 幫我看看這個工地玩具有沒有包含車輛在內？還是只有場景？GPT-4o 給我的回答是：

ChatGPT o3 o4-mini 模型 OpenAI

他一開始說有包含車輛，後來經過我提醒，他才跟我說「可能」沒有。我再確認了一次，他才比較肯定的跟我說沒有。

新版 GPT-o3

同樣的內容我丟給 GPT-o3 呢？他會先分析我的問題，然後開始掃描圖片。

ChatGPT o3 o4-mini 模型 OpenAI

甚至還會把可能有線索的地方特別放大來重點掃描。

ChatGPT o3 o4-mini 模型 OpenAI

最後他非常肯定的跟我說「沒有」！所以相較 GPT-4o 來說，GPT-o3 的穩定度和正確率都高出不少。

雖然 GPT-4o 也是很強的「全方位模型」，但 o3 和 o4-mini 是專門針對「推理任務」優化，且首次全面整合工具能力。