OpenAI 宣布推出具有推理能力的 o1 模型:和 GPT-4 差在哪?實測給你看

ChatGPT OpenAI o1 語言模型 GPT-4o

OpenAI 今天(9/13)正式宣布推出全新的 o1 模型,號稱是目前最聰明、最具有推理能力而且準確度更高的一款 AI 模型,並同時推出 o1 mini 版本,並且開放 Beta 版給 ChatGPT Plus 會員以及企業會員使用。

o1 模型在推理、數學、科學項目上表現更出色

OpenAI 這款全新 o1 模型據說是開發團隊早期的一款 LLM 模型,經過多次改良並給予更多的訓練後有更加的表現,能夠解決更多科學、程式撰寫、數學邏輯…等相較過去更困難的問題,而且 o1 模型會像人類一樣,透過不斷地訓練來補足自己的思考過程,再利用不同的邏輯和步驟來修正。

OpenAI 也表示 o1 模型並不是用來取代 GPT-4o 的,而是在 GPT-4o 的基礎上更加強化,像是以國際數學奧林匹亞競賽 IMO 的考題來做測試,GPT-4o 的解答率為 13%,o1 模型則高達 83%,也比 Google 語言模型表現更好。

在其他多種不同的物理、化學以及生物學等項目上,o1 的表現也和博士生沒有兩樣,甚至在數學和程式編輯上更出色。

▼ 可以明顯看出在各基礎表現上 o1 都比 gpt4o 更好

ChatGPT OpenAI o1 語言模型 GPT-4o

實測 o1 模型推理表現

我實際拿了一個網路上的邏輯推理題目來問 o1 模型,這是一個 8 個人座位排列的描述,要透過描述理清到底這 8 個人是坐在哪裡,並選出正確的選項。

ChatGPT OpenAI o1 語言模型 GPT-4o

最終執行的結果 o1 確實給出了正確的答案。

ChatGPT OpenAI o1 語言模型 GPT-4o

反而用 GPT-4o 來跑的話,會只給出 C 是正確的結果,但其實 B 選項也是正確的。這也可以驗證 o1 模型的推理基礎真的比較強!

ChatGPT OpenAI o1 語言模型 GPT-4o

o1 模型比 GPT-4o 不足的地方

不過 o1 模型還是有不足的地方,它無法解決圖像分析、圖像生成、瀏覽網頁、上傳檔案,以及語音相關的功能,這些功能目前還是 GPT-4o 的表現是最好的。

而且在執行速度上,可能 o1 要思考的邏輯比較多,所以相對 GPT-4o 來說執行速度有點慢,因為在思考與推理的過程中 o1 會執行非常多步驟,而且嘗試各種可能的排列組合。

這是上面測試 o1 時畫面上顯示的步驟,你可以看到 o1 執行了非常多的步驟,這也是為什麼速度會比較慢的原因,而且這還是加速 4 倍後的結果。

此外,o1 模型在 API 的使用費率上也比 GPT-4o 貴上不少,o1 Preview 模型每 100 萬個輸入 token 收費 15 美元、輸出 token 收費 60 美元,而 GPT-4o 在輸入與輸出上分別是 5 美元與 15 美元,o1 是 GPT-4o 的 3 倍、4 倍。

o1 模型已開放 Plus 會員使用

如果你是 ChatGPT Plus 的會員,現在就已經可以在模型選項中選擇 o1 來使用,如果是 ChatGPT 企業版或是教育版的會員,則會在下週起陸續開始使用。

ChatGPT OpenAI o1 語言模型 GPT-4o

這功能未來也會開放給一般的 ChatGPT 會員使用,無需註冊 Plus,但目前什麼時候可以開放還不知道。

延伸閱讀》

OpenAI 最新 GPT-4o 有哪些好用功能?這裡一次幫你彙整

OpenAI 推出 GPT-4o mini 模型:性能更好、應用更廣泛,免費帳戶也能無限用

ChatGPT 開放免費使用者每天生成 2 張圖片額度

ChatGPT App 是哪個?可以免費下載嗎?這裡告訴你

ChatGPT for Mac 宣布免費開放!下載位置與 5 大體驗特色一次看

如果想知道更多關於 Apple 的消息、教學、小技巧或是科技新知,一定要點擊以下任一 LOGO,追蹤我們的 Facebook 粉絲團、訂閱 IG、YouTube 以及 Telegram。

加入LINE好友  追蹤FB粉絲團  追蹤 Instagram  訂閱 YouTube  訂閱 Telegram