AI 科技

GPT-o3 / o4-mini 模型推出!實測整合搜尋、圖像辨識與推理真的更好用

ChatGPT o3 o4-mini 模型 OpenAI

OpenAI 又推出新的模型了!這次推出兩款新模型 GPT-o3 和 GPT-o4-mini,不只在推理能力上全面升級,更首度整合了 搜尋、Python、圖像分析與生成工具,不只更聰明,還能更「主動」幫你解決複雜問題。

不過你可能會想問:「既然已經有 GPT-4o,那麼 o3、o4-mini 又是什麼?這些名字到底有什麼差別?」我們這篇文章就幫你一次搞懂:新模型 o3 和 o4-mini 到底多強?跟舊版本差在哪?對一般使用者又有什麼實際幫助?

o3 和 o4-mini 有什麼新功能?

根據 OpenAI 官方說明,GPT-o3 是目前 OpenAI 最聰明的模型,在程式、數學、視覺分析等領域表現最佳,甚至能自己判斷何時該使用工具(像是網頁搜尋或 Python)。

o3、o4-mini 都能整合 ChatGPT 的內建工具,包括:

  • 即時搜尋網路資料
  • 使用 Python 做分析或繪圖
  • 解讀與生成圖片

這代表,使用者只要提出一個問題,模型可以自行決定先搜尋資料、再跑程式、最後畫圖解釋,變成一個會自己動手做事的 AI 助理!

例如你可以上傳一張圖片,即便看不太清楚,GPT-o3 也可以幫你解析,然後試著用不同的角度去思考你可能想要知道些什麼,並且在必要的時候直接搜尋和這張圖片的相關資訊。

ChatGPT o3 o4-mini 模型 OpenAI

上面的圖片你可以看到,我只是跟他說這個雕像好特別,他就會自動幫我辨識圖像內容,然後搜尋和這個雕像相關的資訊。

新舊版 ChatGPT 差在哪裡?

主動性有差

直接給大家一個最直接的舉例,同樣用上面那張雕像的照片當作例子。

舊版 GPT-4o

我把相同的照片、描述文字(這個雕像好特別)丟給 GPT-4o 的模型,結果會是這樣。

ChatGPT o3 o4-mini 模型 OpenAI

雖然同樣會帶出雕像的資訊,但因為不會主動連網搜尋(其實 4o 也會,但是主動性不高),所以帶出來的資訊可能會是過時的。

新版 GPT-o3

而新的 GPT-o3 模型則會主動查找相關的資訊,你可以看到每一個資訊旁邊都會註明出處,讓你知道這些資訊都是從哪裡來的。

ChatGPT o3 o4-mini 模型 OpenAI

此外,GPT-o3 還會思考,想說你可能會想要親臨現場看一看,所以提供交通資訊、位置、門票價格給你。

ChatGPT o3 o4-mini 模型 OpenAI

我自己覺得最大的差異,是舊版的 GPT 模型通常就是你一個口令他一個動作,但是新版的 GPT-o3 或是 o4-mini 會先考慮你可能的需求,然後一口氣把可以呈現的資料都呈現出來,減少一來一回的時間,算是蠻不錯的。

正確度更高

搭配搜尋、圖像辨識的功能,新版的 GPT-o3 回答正確度也真的大幅提高。

舊版 GPT-4o

下面這張圖是我之前請 GPT-4o 幫我看看這個工地玩具有沒有包含車輛在內?還是只有場景?GPT-4o 給我的回答是:

ChatGPT o3 o4-mini 模型 OpenAI

他一開始說有包含車輛,後來經過我提醒,他才跟我說「可能」沒有。我再確認了一次,他才比較肯定的跟我說沒有。

新版 GPT-o3

同樣的內容我丟給 GPT-o3 呢?他會先分析我的問題,然後開始掃描圖片。

ChatGPT o3 o4-mini 模型 OpenAI

甚至還會把可能有線索的地方特別放大來重點掃描。

ChatGPT o3 o4-mini 模型 OpenAI

ChatGPT o3 o4-mini 模型 OpenAI

最後他非常肯定的跟我說「沒有」!所以相較 GPT-4o 來說,GPT-o3 的穩定度和正確率都高出不少。

ChatGPT o3 o4-mini 模型 OpenAI

GPT-4o、GPT-o1、GPT-o3、GPT-o4-mini 差異比較

雖然 GPT-4o 也是很強的「全方位模型」,但 o3 和 o4-mini 是專門針對「推理任務」優化,且首次全面整合工具能力。

  適合場景 特色 整合工具
GPT-4o 一般聊天、翻譯、語音互動 速度快、支援語音與視訊 有限
GPT-o1 簡單推理任務 過往的基本推理模型
GPT-o3 進階推理、圖像/程式分析 推理力最強、支援所有工具
GPT-o4-mini 快速回答、效能優先 推理力不輸大模型,省資源

此外,很多人應該對於 GPT 模型的命名感到困惑,其實很簡單。

你可以把 O 開頭的想像成是「Operations」,和工具有關的,所以想是要使用搜尋、推理、整合….等等的,O 開頭系列的會比較厲害。

付費帳號已經可以使用

只要你是 ChatGPT Plus 或 Team 用戶,現在就可以切換到 o3 或 o4-mini 模型來使用。

最後也總結一下 o3、o4-mini 重點:

  • 整合搜尋、Python、圖像生成工具
  • 會思考「該不該用工具」來幫你回答問題
  • 推理能力與過往模型差距非常明顯
  • 操作更自然、更像對話
  • 效能更高、使用成本更低

延伸閱讀》

如果想知道更多關於 Apple 的消息、教學、小技巧或是科技新知,一定要點擊以下任一 LOGO,追蹤我們的 Facebook 粉絲團、訂閱 IG、YouTube 以及 Telegram。

加入LINE好友  追蹤FB粉絲團  追蹤 Instagram  訂閱 YouTube  訂閱 Telegram

Related Articles