OpenAI 宣布推出具有推理能力的 o1 模型：和 GPT-4 差在哪？實測給你看

最後更新： 2024 年 9 月 13 日

ChatGPT OpenAI o1 語言模型 GPT-4o

OpenAI 今天（9/13）正式宣布推出全新的 o1 模型，號稱是目前最聰明、最具有推理能力而且準確度更高的一款 AI 模型，並同時推出 o1 mini 版本，並且開放 Beta 版給 ChatGPT Plus 會員以及企業會員使用。

o1 模型在推理、數學、科學項目上表現更出色

OpenAI 這款全新 o1 模型據說是開發團隊早期的一款 LLM 模型，經過多次改良並給予更多的訓練後有更加的表現，能夠解決更多科學、程式撰寫、數學邏輯…等相較過去更困難的問題，而且 o1 模型會像人類一樣，透過不斷地訓練來補足自己的思考過程，再利用不同的邏輯和步驟來修正。

OpenAI 也表示 o1 模型並不是用來取代 GPT-4o 的，而是在 GPT-4o 的基礎上更加強化，像是以國際數學奧林匹亞競賽 IMO 的考題來做測試，GPT-4o 的解答率為 13%，o1 模型則高達 83%，也比 Google 語言模型表現更好。

在其他多種不同的物理、化學以及生物學等項目上，o1 的表現也和博士生沒有兩樣，甚至在數學和程式編輯上更出色。

▼ 可以明顯看出在各基礎表現上 o1 都比 gpt4o 更好

ChatGPT OpenAI o1 語言模型 GPT-4o

我實際拿了一個網路上的邏輯推理題目來問 o1 模型，這是一個 8 個人座位排列的描述，要透過描述理清到底這 8 個人是坐在哪裡，並選出正確的選項。

ChatGPT OpenAI o1 語言模型 GPT-4o

最終執行的結果 o1 確實給出了正確的答案。

ChatGPT OpenAI o1 語言模型 GPT-4o

反而用 GPT-4o 來跑的話，會只給出 C 是正確的結果，但其實 B 選項也是正確的。這也可以驗證 o1 模型的推理基礎真的比較強！

ChatGPT OpenAI o1 語言模型 GPT-4o

不過 o1 模型還是有不足的地方，它無法解決圖像分析、圖像生成、瀏覽網頁、上傳檔案，以及語音相關的功能，這些功能目前還是 GPT-4o 的表現是最好的。

而且在執行速度上，可能 o1 要思考的邏輯比較多，所以相對 GPT-4o 來說執行速度有點慢，因為在思考與推理的過程中 o1 會執行非常多步驟，而且嘗試各種可能的排列組合。

這是上面測試 o1 時畫面上顯示的步驟，你可以看到 o1 執行了非常多的步驟，這也是為什麼速度會比較慢的原因，而且這還是加速 4 倍後的結果。

此外，o1 模型在 API 的使用費率上也比 GPT-4o 貴上不少，o1 Preview 模型每 100 萬個輸入 token 收費 15 美元、輸出 token 收費 60 美元，而 GPT-4o 在輸入與輸出上分別是 5 美元與 15 美元，o1 是 GPT-4o 的 3 倍、4 倍。

如果你是 ChatGPT Plus 的會員，現在就已經可以在模型選項中選擇 o1 來使用，如果是 ChatGPT 企業版或是教育版的會員，則會在下週起陸續開始使用。

ChatGPT OpenAI o1 語言模型 GPT-4o

這功能未來也會開放給一般的 ChatGPT 會員使用，無需註冊 Plus，但目前什麼時候可以開放還不知道。

延伸閱讀》

OpenAI 最新 GPT-4o 有哪些好用功能？這裡一次幫你彙整

如果想知道更多關於 Apple 的消息、教學、小技巧或是科技新知，一定要點擊以下任一 LOGO，追蹤我們的 Facebook 粉絲團、訂閱 IG、YouTube 以及 Telegram。