OpenAI 宣布推出具有推理能力的 o1 模型：和 GPT-4 差在哪？實測給你看

OpenAI 今天（9/13）正式宣布推出全新的 o1 模型，號稱是目前最聰明、最具有推理能力而且準確度更高的一款 AI 模型，並同時推出 o1 mini 版本，並且開放 Beta 版給 ChatGPT Plus 會員以及企業會員使用。

o1 模型在推理、數學、科學項目上表現更出色

OpenAI 這款全新 o1 模型據說是開發團隊早期的一款 LLM 模型，經過多次改良並給予更多的訓練後有更加的表現，能夠解決更多科學、程式撰寫、數學邏輯…等相較過去更困難的問題，而且 o1 模型會像人類一樣，透過不斷地訓練來補足自己的思考過程，再利用不同的邏輯和步驟來修正。

OpenAI 也表示 o1 模型並不是用來取代 GPT-4o 的，而是在 GPT-4o 的基礎上更加強化，像是以國際數學奧林匹亞競賽 IMO 的考題來做測試，GPT-4o 的解答率為 13%，o1 模型則高達 83%，也比 Google 語言模型表現更好。

在其他多種不同的物理、化學以及生物學等項目上，o1 的表現也和博士生沒有兩樣，甚至在數學和程式編輯上更出色。

▼ 可以明顯看出在各基礎表現上 o1 都比 gpt4o 更好

實測 o1 模型推理表現

我實際拿了一個網路上的邏輯推理題目來問 o1 模型，這是一個 8 個人座位排列的描述，要透過描述理清到底這 8 個人是坐在哪裡，並選出正確的選項。

最終執行的結果 o1 確實給出了正確的答案。

反而用 GPT-4o 來跑的話，會只給出 C 是正確的結果，但其實 B 選項也是正確的。這也可以驗證 o1 模型的推理基礎真的比較強！

o1 模型比 GPT-4o 不足的地方

不過 o1 模型還是有不足的地方，它無法解決圖像分析、圖像生成、瀏覽網頁、上傳檔案，以及語音相關的功能，這些功能目前還是 GPT-4o 的表現是最好的。

而且在執行速度上，可能 o1 要思考的邏輯比較多，所以相對 GPT-4o 來說執行速度有點慢，因為在思考與推理的過程中 o1 會執行非常多步驟，而且嘗試各種可能的排列組合。

這是上面測試 o1 時畫面上顯示的步驟，你可以看到 o1 執行了非常多的步驟，這也是為什麼速度會比較慢的原因，而且這還是加速 4 倍後的結果。

此外，o1 模型在 API 的使用費率上也比 GPT-4o 貴上不少，o1 Preview 模型每 100 萬個輸入 token 收費 15 美元、輸出 token 收費 60 美元，而 GPT-4o 在輸入與輸出上分別是 5 美元與 15 美元，o1 是 GPT-4o 的 3 倍、4 倍。

o1 模型已開放 Plus 會員使用

如果你是 ChatGPT Plus 的會員，現在就已經可以在模型選項中選擇 o1 來使用，如果是 ChatGPT 企業版或是教育版的會員，則會在下週起陸續開始使用。

這功能未來也會開放給一般的 ChatGPT 會員使用，無需註冊 Plus，但目前什麼時候可以開放還不知道。

延伸閱讀》

OpenAI 最新 GPT-4o 有哪些好用功能？這裡一次幫你彙整

OpenAI 推出 GPT-4o mini 模型：性能更好、應用更廣泛，免費帳戶也能無限用

ChatGPT 開放免費使用者每天生成 2 張圖片額度

ChatGPT App 是哪個？可以免費下載嗎？這裡告訴你

ChatGPT for Mac 宣布免費開放！下載位置與 5 大體驗特色一次看

如果想知道更多關於 Apple 的消息、教學、小技巧或是科技新知，一定要點擊以下任一 LOGO，追蹤我們的 Facebook 粉絲團、訂閱 IG、YouTube 以及 Telegram。

AI 怎麼用？給從沒用過的新手教學，5 分鐘馬上能幫你做事的基礎入門課

你可能常聽到身邊的人說「這丟給 AI 就好了啊」，但自己從來沒用過，也不知道從哪裡開始。其實現在的 AI 工具不用下載、不用學任何指令，打開網頁就能用；而它最有...

4 小時 ago

新聞

Apple BTS 2026 台灣開始時間為何？預計最快本週或延到 8 月初登場

不知道是不是因為受到記憶體、儲存元件等成本飆升影響，導致今年 Apple BTS 活動暫緩推出；如今 7 月中都還沒看到半點風聲，外界都好奇今年是否還有 App...

6 小時 ago

新聞

Pixel 11 Pro Fold 新色曝光！Google「Pine」綠登場，機身更薄、相機模組也改

Google 摺疊手機 Pixel 11 Pro Fold 再度提前曝光，這次重點是全新「Pine」配色，以及更俐落的相機模組設計。從最新流出的渲染圖來看，Go...

7 小時 ago

新聞

Claude Fable 5 免費使用再延長至 7/20，Claude Code 額度加碼同步續期

Claude Fable 5 免費使用期限原定是到 7/12，相信各位應該也在上週把握機會用好用滿；但沒想到 Anthropic 稍早宣布 Claude Fab...

10 小時 ago

新聞

2026 普發一萬最新進度：地方振興金登記、領取方式、資格一次看

目前網路討論的政府普發現金資訊，至少可分成三種：上一輪中央全民普發 1 萬元、立法院正在審查的新一波「國民支援金」，以及各縣市、鄉鎮自行推出的地方振興金。先說...

10 小時 ago

新聞

2 款新 Apple Pencil 傳明年登場，可能首度改用可更換電池設計

Apple Pencil 可能明年迎來新版本，而且一次就是 2 款。根據《彭博》記者 Mark Gurman 的說法，Apple 正在開發新一代 Apple P...

12 小時 ago

OpenAI 宣布推出具有推理能力的 o1 模型：和 GPT-4 差在哪？實測給你看

o1 模型在推理、數學、科學項目上表現更出色

實測 o1 模型推理表現

o1 模型比 GPT-4o 不足的地方

o1 模型已開放 Plus 會員使用

相關

OpenAI 推出 GPT-4o mini 模型：性能更好、應用更廣泛，免費帳戶也能無限用

ChatGPT 高階語音模型可以用了！回應更自然、還能即時口譯、辨識畫面

OpenAI 正式推出進階語音模式！互動更人性化還可以打斷 AI 說話

Recent Posts

AI 怎麼用？給從沒用過的新手教學，5 分鐘馬上能幫你做事的基礎入門課

Apple BTS 2026 台灣開始時間為何？預計最快本週或延到 8 月初登場

Pixel 11 Pro Fold 新色曝光！Google「Pine」綠登場，機身更薄、相機模組也改

Claude Fable 5 免費使用再延長至 7/20，Claude Code 額度加碼同步續期

2026 普發一萬最新進度：地方振興金登記、領取方式、資格一次看

2 款新 Apple Pencil 傳明年登場，可能首度改用可更換電池設計

OpenAI 宣布推出具有推理能力的 o1 模型：和 GPT-4 差在哪？實測給你看

o1 模型在推理、數學、科學項目上表現更出色

實測 o1 模型推理表現

o1 模型比 GPT-4o 不足的地方

o1 模型已開放 Plus 會員使用

相關

Related Post

Recent Posts

Headline