Vera Rubin 是什麼？一文搞懂 NVIDIA 為代理式 AI 打造的新一代系統

最後更新： 2026 年 6 月 1 日

NVIDIA 在 2026 Taipei GTC 大會上，最重要的硬體發表之一，就是宣布 Vera Rubin 已進入全面生產。

如果只把 Vera Rubin 看成 NVIDIA 下一代 GPU，可能會低估它的重點。按照黃仁勳在大會上的說法，Vera Rubin 不是單一晶片，而是一整套為「代理式 AI」設計的 AI 運算系統。它整合 GPU、CPU、網路、儲存、安全處理器與液冷機櫃，目標是支撐未來大量 AI agent 同時運作。

Vera Rubin 是什麼

為什麼需要 Vera Rubin？

過去很多 AI 應用比較像是「你問，它回答」。例如請 AI 寫一段文字、產生圖片、翻譯內容，或回答一個問題。但代理式 AI 不一樣，它不只是產生答案，而是會理解任務、拆解步驟、使用工具，最後完成工作。

例如使用者可以請 AI 產生程式碼、製作動畫，甚至根據遙控器電池蓋的照片，建立可用於 3D 列印的 CAD 檔案。這些例子要說明的是，未來的 AI 不只是聊天工具，而是會實際進入工作流程。

但當 AI 開始「做事」，背後需要的運算方式也會改變。一個 AI agent 在執行任務時，可能會反覆進行這些動作：

動作	說明
理解任務	看懂使用者想完成什麼
規劃步驟	決定先做什麼、再做什麼
使用工具	呼叫瀏覽器、資料庫、程式工具或設計軟體
存取記憶	讀取上下文、文件、知識庫或過去結果
檢查輸出	判斷結果是否正確，必要時重新修改
交付成果	產生程式、文件、圖像、模型或其他結果

這些流程會讓 CPU、GPU、記憶體、儲存與網路都被大量使用。也因此，NVIDIA 認為單靠更快的 GPU 已經不夠，必須從整個系統架構重新設計。

Vera Rubin 就是為這個需求而來。

Vera Rubin是什麼？它不是一顆晶片，而是一整套 AI 系統

2026 GTC Taipei Taiwan 懶人包

首先，NVIDIA 的 Vera Rubin 名稱其實是來自美國天文學家 Vera Rubin（薇拉·魯賓），是一名研究星系自轉速度的先驅。她最知名的研究工作是發現了實際觀察的星系轉速與原先理論的預測有所出入。NVIDIA 近年來很多大型系統都是和科技、天文命名有關，例如之前的 Grace Hopper。

那麼 Vera Rubin 是什麼？Vera Rubin 不是一顆 GPU，也不是單一伺服器，而是一整套從端到端設計的系統。它包含：

組成	作用
Vera Rubin GPU	負責大型 AI 模型推理、理解、規劃與 token 生成
Vera CPU	負責協調 agent、管理工具呼叫、資料存取與流程控制
NVLink 72	讓 GPU 與系統內部元件高速互連
BlueField	處理安全、隔離、儲存與資料中心管理
ConnectX-9	提供高速網路連接
儲存系統	支援 agent 讀取記憶、資料與上下文
液冷機櫃	協助高密度 AI 系統散熱
安全架構	保護模型、資料與運算流程

而代理式 AI 和一般 AI 推論最大的差別，在於它不是一次性回答問題，而是會反覆思考、查資料、呼叫工具、修正結果。

例如一個 coding agent 幫你修改程式時，它可能會：

先讀取專案檔案，理解程式架構；
接著產生修改方案；
再呼叫工具執行測試；
如果測試失敗，就回頭修改程式；
最後提交完成的版本。

這個過程中，AI 不只需要 GPU 產生文字，也需要 CPU 執行工具、儲存系統讀取檔案、網路系統傳輸資料，還需要安全機制限制權限。

所以 Vera Rubin 的重點，不只是「更快產生答案」，而是讓 agent 在多步驟任務中跑得更穩定、更快速，整體更有效率。

Vera CPU：Vera Rubin 裡的核心關鍵角色

Vera Rubin 裡面不只有 GPU，Vera CPU 也是這次 NVIDIA 特別強調的重點。

很多人談 AI 時會先想到 GPU，因為大型模型訓練與推論需要大量平行運算。但在代理式 AI 裡，CPU 的角色變得更重要。

原因很簡單：AI agent 會一直呼叫工具。

它可能要跑 Python、執行 JavaScript、編譯程式、查資料庫、讀取文件、整理記憶，甚至啟動其他子 agent。這些工作不一定都由 GPU 處理，很多時候需要 CPU 協調。

黃仁勳在大會上說，過去 CPU 是為人類使用電腦的方式設計；但 agent 的節奏不同。人類可以等幾秒，agent 卻需要以更低延遲完成下一步。每一次等待，都會拖慢整個任務流程。

因此 Vera CPU 的設計重點包括：

重點	原因
單執行緒效能	讓工具呼叫與程式執行更快
高記憶體頻寬	加速資料讀取與處理
高核心間頻寬	讓 CPU 核心之間更快交換資料
高能源效率	避免 CPU 消耗過多電力，影響 GPU 可用電力
與 GPU 緊密連接	讓 CPU 和 GPU 更快協作

Vera CPU 採用 Olympus core，使用 LPDDR5X 記憶體，並可透過 NVLink chip-to-chip 與 GPU 連接。NVIDIA 也表示，Vera CPU 在 agentic sandbox 工作負載上可達 x86 CPU 的 1.8 倍表現，SQL 工作負載可達 3 倍速度，即時串流處理案例則提到 6 倍表現。

延伸閱讀

2026 Taipei GTC 懶人包：從 Vera Rubin、AI PC、機器人到自駕車，11 大重點一次看完

Vera Rubin 和 AI 工廠又有什麼關係？

NVIDIA 這幾年一直談「AI 工廠」。在這次 GTC 上，Vera Rubin 正是 AI 工廠裡最核心的運算系統之一。

所謂 AI 工廠，可以理解成專門生產 AI 服務與 token 的資料中心。黃仁勳認為，當 AI token 可以帶來收入，資料中心就不只是放伺服器的地方，而是像工廠一樣，負責持續產出 AI 服務。

在這個邏輯下，Vera Rubin 的角色就是提升 AI 工廠的產能與效率。AI 工廠關心的不只是晶片價格，而是：

指標	為什麼重要
上線速度	越快啟用，越快產生 AI 服務
tokens per watt	每瓦電能產生多少 token，影響成本
可靠性	系統中斷會影響服務與收益
使用壽命	架構越能支援新模型，總持有成本越低
部署效率	大規模 AI 工廠需要快速安裝與維護

這也是為什麼 NVIDIA 不斷強調 Vera Rubin 是完整系統，而不只是更快的 GPU。因為對 AI 工廠來說，真正重要的是整體效率與穩定性。

Vera Rubin 的重點規格與特色整理

項目	Vera Rubin 重點
定位	為代理式 AI 打造的新一代 AI 系統
狀態	已進入全面生產
核心架構	多機櫃、pod-scale AI 超級電腦
主要用途	執行 AI agent、推理、工具呼叫、記憶存取與多步驟任務
製程	台積電 3 奈米
封裝	CoWoS-R、CoWoS-L
記憶體	HBM4，來自 Micron、SK Hynix、Samsung
系統組成	GPU、Vera CPU、NVLink 72、BlueField、ConnectX-9、儲存、網路、安全與液冷
供應鏈	涉及台灣 150 家供應鏈夥伴
系統設計	減少纜線、軟管與風扇，提升組裝效率與可靠性