新聞

OpenAI 宣布推出具有推理能力的 o1 模型:和 GPT-4 差在哪?實測給你看

OpenAI 今天(9/13)正式宣布推出全新的 o1 模型,號稱是目前最聰明、最具有推理能力而且準確度更高的一款 AI 模型,並同時推出 o1 mini 版本,並且開放 Beta 版給 ChatGPT Plus 會員以及企業會員使用。

o1 模型在推理、數學、科學項目上表現更出色

OpenAI 這款全新 o1 模型據說是開發團隊早期的一款 LLM 模型,經過多次改良並給予更多的訓練後有更加的表現,能夠解決更多科學、程式撰寫、數學邏輯…等相較過去更困難的問題,而且 o1 模型會像人類一樣,透過不斷地訓練來補足自己的思考過程,再利用不同的邏輯和步驟來修正。

OpenAI 也表示 o1 模型並不是用來取代 GPT-4o 的,而是在 GPT-4o 的基礎上更加強化,像是以國際數學奧林匹亞競賽 IMO 的考題來做測試,GPT-4o 的解答率為 13%,o1 模型則高達 83%,也比 Google 語言模型表現更好。

在其他多種不同的物理、化學以及生物學等項目上,o1 的表現也和博士生沒有兩樣,甚至在數學和程式編輯上更出色。

▼ 可以明顯看出在各基礎表現上 o1 都比 gpt4o 更好

實測 o1 模型推理表現

我實際拿了一個網路上的邏輯推理題目來問 o1 模型,這是一個 8 個人座位排列的描述,要透過描述理清到底這 8 個人是坐在哪裡,並選出正確的選項。

最終執行的結果 o1 確實給出了正確的答案。

反而用 GPT-4o 來跑的話,會只給出 C 是正確的結果,但其實 B 選項也是正確的。這也可以驗證 o1 模型的推理基礎真的比較強!

o1 模型比 GPT-4o 不足的地方

不過 o1 模型還是有不足的地方,它無法解決圖像分析、圖像生成、瀏覽網頁、上傳檔案,以及語音相關的功能,這些功能目前還是 GPT-4o 的表現是最好的。

而且在執行速度上,可能 o1 要思考的邏輯比較多,所以相對 GPT-4o 來說執行速度有點慢,因為在思考與推理的過程中 o1 會執行非常多步驟,而且嘗試各種可能的排列組合。

這是上面測試 o1 時畫面上顯示的步驟,你可以看到 o1 執行了非常多的步驟,這也是為什麼速度會比較慢的原因,而且這還是加速 4 倍後的結果。

此外,o1 模型在 API 的使用費率上也比 GPT-4o 貴上不少,o1 Preview 模型每 100 萬個輸入 token 收費 15 美元、輸出 token 收費 60 美元,而 GPT-4o 在輸入與輸出上分別是 5 美元與 15 美元,o1 是 GPT-4o 的 3 倍、4 倍。

o1 模型已開放 Plus 會員使用

如果你是 ChatGPT Plus 的會員,現在就已經可以在模型選項中選擇 o1 來使用,如果是 ChatGPT 企業版或是教育版的會員,則會在下週起陸續開始使用。

這功能未來也會開放給一般的 ChatGPT 會員使用,無需註冊 Plus,但目前什麼時候可以開放還不知道。

延伸閱讀》

OpenAI 最新 GPT-4o 有哪些好用功能?這裡一次幫你彙整

OpenAI 推出 GPT-4o mini 模型:性能更好、應用更廣泛,免費帳戶也能無限用

ChatGPT 開放免費使用者每天生成 2 張圖片額度

ChatGPT App 是哪個?可以免費下載嗎?這裡告訴你

ChatGPT for Mac 宣布免費開放!下載位置與 5 大體驗特色一次看

如果想知道更多關於 Apple 的消息、教學、小技巧或是科技新知,一定要點擊以下任一 LOGO,追蹤我們的 Facebook 粉絲團、訂閱 IG、YouTube 以及 Telegram。

        

Recent Posts

Facebook 連結出現此頁面目前無法顯示怎麼辦?教你一招完美解決

我們有時候會接到網友反應說 Facebook 的連結點擊以後打不開網頁,出現「此頁面目前無法顯示」的狀況,這有辦法處理嗎?可以怎麼解決呢?今天就要跟大家分享如何...

20 分鐘 ago

【美國 vs 委內瑞拉】11/23 世界 12 強賽程,愛爾達 Hami、免費轉播直播 LIVE 線上看

中華隊以 3 勝 1 敗的預賽戰績挺進超級循環賽,接著會在東京巨蛋進行世界 12 強賽的複賽。為了讓棒球迷可以觀看精彩比賽,本文將整理 11/23 世界 12 ...

3 小時 ago

iPhone 捷徑自動化通知如何關閉?完整教學看這裡

當 iPhone 捷徑自動化流程啟動時,有時候會跳出一個通知告訴你自動化流程被觸發而啟動了,但有些又不會,這是為什麼?如果想要完全把 iPhone 捷徑自動化流...

3 小時 ago

【勇士 vs 鵜鶘】NBA 直播 LIVE 線上看,11/23 美國職籃線上轉播

勇士對鵜鶘的 NBA 直播來囉!NBA 美國職籃新賽季 2024-2025 例行賽正式開打,一起來看各隊的精彩表現!今天 11/23 勇士和鵜鶘這場 NBA 直...

5 小時 ago

《黑神話 悟空》榮獲金搖桿獎 2024 年度最佳遊戲,《FF7 重生》抱走最多獎項

第 42 屆的英國電玩遊戲獎項「金搖桿獎(Golden Joystick Awards)」,在英國時間 11 月 21 日下午 4 點透過直播節目揭曉包含最大獎...

12 小時 ago

地震速報!11/22 出現芮氏規模 5.4 有感地震

11/22,20:40:18 發生地震,位置在北緯 23.2度,東經 120.18 度,即在臺南市政府北方 23.2 公里 ,位於臺南市佳里區(資訊來源:中央氣...

15 小時 ago