一覺醒來 AI 又變天！Google 版 ChatGPT 開放、Nvidia 推核彈級顯卡....這世界變化真的太快了 - 蘋果仁

圖、文／愛范兒授權轉載

AI 的「iPhone 時刻」已經到來

在剛結束的 Nvidia GTC 2023 大會上，Nvidia CEO 黃仁勳把這個觀點反覆說了 3 遍。

這該怎麼理解呢？

再多年前，iPhone 搭載的多點觸控螢幕技術開創了一個全新的智慧型手機介面互動方式，由此孕育了行動網路的蓬勃發展。

而 ChatGPT、Stable Diffusion 等 AI 超級應用的出現，則意味著加速計算和 AI 技術已邁入成熟，AI 正以一個前所未有的速度滲透各行各業，推動一場新的產業革命。

經過近幾年 AI 技術的不斷發展，強大運算能力和先進模型為 AI 提供了合適的應用平台，促使各個廠商們重新構想自己的產品和商業模型，以及更新迭代的速度。

昨天晚上，Nvidia、微軟、Google、Adobe 等廠商在差不多的時間裡都推出了各自的 AI 服務，你追我趕之勢彷彿在傳達著同一個焦慮：

「在這個大 AI 時代，如果不想被人顛覆，就要先顛覆別人。」

AI 將會怎樣改變我們的生活？

Nvidia 正在把 AI 帶到各行各業

先來說說 Nvidia 吧！

Nvidia 在一年一度的 GTC 大會上又帶來了很多讓人眼前一亮的「新玩意兒」。

例如發布了一項名為 CuLitho 的 AI 輔助晶片製造技術，為 2nm 製程鋪平了道路；與 Lotus、BenZ、BMW 等汽車廠商合作，用 Omniverse 搭建數位生產線等。

但要說到整場 GTC 大會最亮眼的內容，還是 Nvidia 發布的新顯卡，這塊帶有雙 GPU NVLink 的 H100 NVL。

H100 NVL 是專門針對算力需求巨大的 ChatGPT 而設計的顯卡，H100 NVL 擁有誇張的 188GB HBM3 記憶體（每張卡 94GB），這也是目前 Nvidia 發表過記憶體最大的顯卡。

像 GPT 這樣的大語言模型非常佔用記憶體資源，理論上參數達到上千億的 GPT 模型可以迅速佔滿一張 H100 顯卡。

與用於 GPT-3 處理的 HGX A100 相比，使用了四對 H100 和雙 GPU NVLink 標準伺服器的速度快了 10 倍，「核彈級」的 H100 NVL 是大規模部署像 ChatGPT 語言模型的理想選擇。

Nvidia 在發表會上另一個受矚目的焦點則是把「ChatGPT 同款」搬到了雲端，向公眾開放。

ChatGPT 的運作主要依靠由 A100 或 H100 組成的 DGX 超級電腦，微軟為此花了數億美金採購了上萬張 A100 顯卡組建 Azure 雲計算平台。

為了降低用戶部署大模型的成本，Nvidia推出了 DXG Cloud 服務，每個月 36,999 美元起，你就能獲得一個由 8 張 H100 或 A100 顯卡組成的雲端超級電腦，輕鬆完成高負載的運算工作。

2016 年，老黃親手向 OpenAI 交付了第一台 DGX 超級電腦。7 年之後，頂尖的 AI 算力通過 DXG Cloud 有機會走進每家公司，完成在過去不可能完成的任務。

不難想像，像 ChatGPT 這樣能夠改善人類交流、提高工作效率的先進應用會持續湧現，為我們的生活帶來更多的便利和驚喜。

點石成金，二代 Runway 讓你一句話生成各式大片

再來看到影片製作工具。

在網路上流行一句梗：影片不能 P，所以這是真的。

但如今影片不僅可以 P，還可以從無到有直接用 AI 生成，不用畫師、不用攝影、不用後製。只要你往 Runway 中輸入一段文字，它便還你一段震撼人心的短片。

最早，Runway 是一款後製輔助工具，雖然也借助了人工智慧的神奇力量，但所能實現內容並不復雜，不外乎就是擦除物體、圖像格率修正、去除背景、動態追蹤等，可以將它視作 Adobe Premiere 的傻瓜式外掛。

而當 Runway 打開人工智慧的新大門後，它擁有了點石成金的能力。

在去年 9 月公佈的 Gen 1 版本中，它有了文字轉影片的能力。那時的人們，剛剛見識過文字轉圖片的魔力，而 Runway 直接能生成動態影像，簡直是越級打怪般的震撼。

時隔半年，Runway Gen 2 來了。

比起 Gen 1 模型，它實現了更高的時間一致性和保真度，說人話…..就是畫面之間連接的更順暢了，畫質還更好。

用上 Gen 2，距離隨時隨地生成自己想像的影片又更近了，我們輸入一條不算長的 Prompt：

無人機航空拍攝的山脈。

就這樣！然後 Runway 產生出以下畫面。

再來一個 Prompt 試試看：

午後陽光照進紐約市中一幢公寓的窗戶。

來個進階版，給 Runway 輸入圖片和文字，然後輸入 Prompt 後，產生一段短片。

一個男人走在街上，周圍酒吧的霓虹燈照亮了他

下面這張是原圖。

或者是讓一幅靜態圖片動起來。

還可以將一張無貼圖等待渲染的塑模動畫，直接渲染出動態影像。

Runway 的進步有目共睹，在對抗網路模型這條路上越走越遠、越走越順，如今的 Gen 2 版本已經算是「可看」的程度，雖稱不上精緻，但未來可期。

或許到了 Gen 3 版本，我們就能在它的幫助下，一鍵生成爆紅短影音。到時候，這會是那些 YouTuber 們的惡夢嗎？

突發！ Google 開啟 Bard 測試

再來就是最引人注目的一個焦點了。

在大家被 GPT-4 和 Midjourney v5 震撼一週、老黃展望未來 AI 時代的同時，Google 宣布正式開放 Bard 的使用：

請嘗試 Bard，並提供你的感想

根據 Google 的最新展示，相比 ChatGPT，Bard 更像是一個專注於工作學習的隨身助理，你可以在它的協助下，激發想法、滿足好奇心。

你可以讓 Bard 用簡單的語言解釋量子物理學，或者讓它提供腦內風暴，幫你在一年內閱讀 20 本書。

Google 表示，使用者可以在 Bard 的協助下，加速想法、激發好奇心。你可以使用 Bard 提供一些技巧，比如如何實現一年閱讀 20 本書，或者用簡單的語言解釋量子物理學。

在展示內容時，我們還發現了一些細節，Bard 似乎會同時產生多個回答，你可以根據需求選擇最適合你的那一個，並進行持續提問。

當然，ChatGPT 也可以提供多個回答，但它是在回答結束後重新產生，相較來看，Bard 更像是一個會同時提供多種方案的乙方。

可能是 ChatGPT 和 Bing Chat 的負面消息引起了 Google 的重視，後者不斷強調 Bard 目前還只是實驗，Bard 產生的訊息並不代表 Google 的觀點。

Google 表示，雖然 Bard 由大型語言模型提供支援，並會隨著時間推移而日漸強大，但它會學習到一些偏見或者刻板印象，導致它「自信滿滿」地說出一些不準確或者虛假的訊息，比如它會將「ZZ Plant」理解為 Zamioculcas zamioculcas，而不是正確的 Zamioculcas zamiifolia。

有了 Bing Chat「瘋了」的前車之鑑，Bard 的第一個測試版就限制了同一對話中的交流次數，從而保證內容的準確。當你第一次使用 Bard 時，它就會告訴你這只是一個實驗，並期待你的反饋。

作為 Bard 的第一個版本，它暫時還不支援更多語言（包括中文），Google 會持續更新代碼、識別/生成圖片以及多語言支援。

▲ Bard：我不會中文，但希望未來會說

目前，Bard 僅在英國、美國開放使用權限，未來會逐漸擴展到更多國家和地區。

聊天就能做圖，Bing Chat 更進一步

Bing Chat 到底有多熱門，或許從上線一個月就讓 Bing 首次單是使用人次突破 1 億的資料就能說明壹切了。從復雜問題到娛樂聊天，再到靈感創意的實現，Bing Chat 正在重塑我們對網路搜尋的體驗。

現在起，你可以讓 Bing Chat 畫圖了。

微軟為新 Bing 和 Edge 瀏覽器的預覽版更新了三個新功能：Bing Image Creator、人工智慧驅動的 Stories 以及 Knowledge Cards 2.0。其中最重要的當屬可以畫畫的 Bing Image Creator。

微軟表示，人腦處理視覺訊息的速度比文字快約 6 萬倍，Bing 的搜索數據中，圖像是搜索最多的類型之一，而由 DALL·E 模型的高級版本提供支援的 Bing Image Creator，可以讓我們通用自己的語言在 Bing Chat 中描述圖片訊息、選擇藝術風格，Image Creator 就會根據上下文，將你的想像「畫在紙上」。

Bing Image Creator 的加入，讓 Edge 瀏覽器變成了第一個集成人工智慧圖像產生功能的瀏覽器。