AI 科技新聞

xAI 新一代模型 Grok 3 登場!馬斯克的「地表最強 AI 模型」有哪些特色?

xAI Grok Grok 3

日前馬斯克旗下的 AI 公司 xAI 正式對外發表新一代 AI 模型「Grok 3」,強調在推理能力、計算效率、創造力等多方面皆有大幅進步,表現不僅碾壓 ChatGPT、Claude 以及 Gemini,馬斯克甚至表示最終目標是「理解宇宙」探索生命的意義、宇宙的起源和結局、尋找外星文明。

究竟馬斯克的地表最強 AI 模型「Grok 3」有什麼特色呢?這邊帶大家從發表會內容來快速理解 Grok 3。

xAI 和 Grok 的最終目標是理解宇宙

馬斯克在發表會開場時表示 xAI 和 Grok 的目標是「理解宇宙」,解答外星人在哪?生命的意義是什麼?宇宙的起源與終點?等人類討論多年的問題。

Grok 這個詞來自美國著名科幻小說 《異鄉異客》(Stranger in a Strange Land),意思是 「完全且深刻地理解某事」;所以馬斯克強調 Grok 3 會追求真相,而不迎合「政治正確」,因為理解宇宙就必須嚴格追求真理。

xAI Grok Grok 3

xAI 訓練規模與算力大幅提升

xAI 目前的進展也相當驚人!在 Grok 1 時期僅 314 億參數,到了 Grok 1.5 和 Grok 2 持續提升性能,現在 Grok 3 的算力已經比 Grok 2 提升 10 倍以上,甚至最高可達 15 倍。

包括 xAI 數據中心的也隨之倍增,早期 Grok 2 訓練時僅有 8,000 顆 NVIDIA H100 GPU(實際有效訓練約 6,500 顆),而在短短的 122 天內已建置達 100,000 顆 NVIDIA H100 GPU,未來也計劃在 92 天內再擴建一倍,讓訓練效能極大提升。

這也讓 Grok 3 每天都在提升能力,甚至 24 小時內就能看到改善;未來 xAI 也將開放 API,讓開發者能夠將 Grok 3 整合到各種應用情境中。

xAI Grok Grok 3

Grok 3 的技術突破與特色

加入更強的推理與自我修正機制

Grok 3 的一大特色就是推理能力大幅提升,不僅是記憶數據、而是能夠深度進行推理與自我修正,能夠大幅增強數學與科學推理、編碼等能力。

自我檢查與錯誤修正機制,能讓 Grok 3 在思考過程中檢查自己的錯誤、並嘗試不同方案來選擇最佳結果,這讓 Grok 3 能夠泛化學習,除了適用於數學和編碼,還能應用到其他領域。

Deep Search AI 搜尋技術創新

「Deep Search」是 Grok 3 的一種全新 AI 搜尋引擎(可看作是 ChatGPT 的 Search GPT 功能),與傳統搜尋引擎不同,Deep Search 並非只提供搜尋結果的連結,而是會:

• 理解用戶的真正需求,並非僅比對關鍵字。
• 自動檢索、交叉比對資訊來源,確保答案的準確性。
• 根據情境整理資訊,給出經過推理的回答。
• 展示 AI 的思考過程,讓用戶了解搜尋結果的可信度。

除此之外,Deep Search 還能即時檢索 X(推特)平台上的資訊,並且比對社群上的即時討論內容,以提供最新、最相關的資訊;這讓 Deep Search 在處理即時新聞、熱門話題、運動賽事、金融市場動態等方面,都比傳統搜尋引擎更具優勢。

進階推理模式(Big Brain 模式)

Grok 3 還有個「進階推理模式(Big Brain 模式)」,當遇到困難問題時 Grok 3 會使用更多算力、更長時間思考來獲得更準確答案。

例如在創造遊戲時,使用進階推理模式可確保 AI 能夠真正產生創新的遊戲機制,而非僅是簡單模仿現有遊戲。

Grok 3 的三種變體與特色

Grok 3 也類似 OpenAI 的 GPT 模型一樣具有多種變體,發表會中提到 Grok 3 具有 3 種版本:

  • Grok 3 標準版:完整版本,具備進階推理、Deep Search、Big Brain 模式、個人化記憶。
  • Grok 3 Mini:小型版本,運算需求較低,適合行動裝置、輕量應用與企業 API 整合。
  • Grok 3 Reasoning:強化推理能力,具備自我檢查、驗證與修正功能,適合數學、科學研究與工程應用。

Grok 3 多項測試表現皆優於 GPT-4、Claude 3、Gemini Pro

當然在 Grok 3 發表會 中,xAI 團隊也展示多種測試數據,證明 Grok 3 在推理、數學、科學、編碼、即時應用等方面的強大能力。

在數學(AIME 2024)、科學問答(GPQA)和編碼(LCB)等多項基準測試中 Grok 3 超越 GPT-4o 和 Gemini-2 Pro 以及前陣子很夯的 DeepSeek V3。

xAI Grok Grok 3

在 Chatbot Arena 的盲項測試中(就是用戶提交問題,並由 AI 生成兩個回應(不同模型的回答,但不標示 AI 來源),Grok 3 獲得 1,400 ELO 分數,排名第一。

Grok 3 目前僅開放 X Premium Plus 用戶使用

目前 Grok 3 僅開放給 X 的 Premium Plus 用戶使用,訂閱費用為 $1,490 / 月或 $1,250 / 年,可使用完整 AI 聊天、Deep Search 與進階推理模式。

xAI Grok Grok 3

Grok 3 獨立 App 與網站也已上線,另外還有「Super Grok」高級訂閱服務,可解鎖推理模式、DeepSearch、無限圖片生成,不過價格尚未公布;未來還將推出企業 API、語音模式(Grok Voice)與個人化記憶功能,而預計在一週後 Gork 3 也會整合到特斯拉車機中,提供駕駛 AI 應用。

此外,發表會中也補充表示 Grok 4 已經開始訓練,將使用「五倍計算資源」運算能力遠超 Grok 3,還會支援多模態(Multimodal)能夠處理 圖像、影片、語音等多種格式輸入,預計在 2025 年內推出。

以上就是 xAI 的最新 AI 模型 Grok 3 的介紹,說實話訂閱費用確實不便宜,但若想先體驗 Grok 的魅力可以先下載 Grok App 免費試用看看 Grok 2(中文可通),再來比較哪一種 AI 最適合你。

延伸閱讀》

Related Articles