圖、文/愛范兒授權轉載
AI 的「iPhone 時刻」已經到來
在剛結束的 Nvidia GTC 2023 大會上,Nvidia CEO 黃仁勳把這個觀點反覆說了 3 遍。
這該怎麼理解呢?
再多年前,iPhone 搭載的多點觸控螢幕技術開創了一個全新的智慧型手機介面互動方式,由此孕育了行動網路的蓬勃發展。
而 ChatGPT、Stable Diffusion 等 AI 超級應用的出現,則意味著加速計算和 AI 技術已邁入成熟,AI 正以一個前所未有的速度滲透各行各業,推動一場新的產業革命。
經過近幾年 AI 技術的不斷發展,強大運算能力和先進模型為 AI 提供了合適的應用平台,促使各個廠商們重新構想自己的產品和商業模型,以及更新迭代的速度。
昨天晚上,Nvidia、微軟、Google、Adobe 等廠商在差不多的時間裡都推出了各自的 AI 服務,你追我趕之勢彷彿在傳達著同一個焦慮:
「在這個大 AI 時代,如果不想被人顛覆,就要先顛覆別人。」
AI 將會怎樣改變我們的生活?
Nvidia 正在把 AI 帶到各行各業
先來說說 Nvidia 吧!
Nvidia 在一年一度的 GTC 大會上又帶來了很多讓人眼前一亮的「新玩意兒」。
例如發布了一項名為 CuLitho 的 AI 輔助晶片製造技術,為 2nm 製程鋪平了道路;與 Lotus、BenZ、BMW 等汽車廠商合作,用 Omniverse 搭建數位生產線等。
但要說到整場 GTC 大會最亮眼的內容,還是 Nvidia 發布的新顯卡,這塊帶有雙 GPU NVLink 的 H100 NVL。
H100 NVL 是專門針對算力需求巨大的 ChatGPT 而設計的顯卡,H100 NVL 擁有誇張的 188GB HBM3 記憶體(每張卡 94GB),這也是目前 Nvidia 發表過記憶體最大的顯卡。
像 GPT 這樣的大語言模型非常佔用記憶體資源,理論上參數達到上千億的 GPT 模型可以迅速佔滿一張 H100 顯卡。
與用於 GPT-3 處理的 HGX A100 相比,使用了四對 H100 和雙 GPU NVLink 標準伺服器的速度快了 10 倍,「核彈級」的 H100 NVL 是大規模部署像 ChatGPT 語言模型的理想選擇。
Nvidia 在發表會上另一個受矚目的焦點則是把「ChatGPT 同款」搬到了雲端,向公眾開放。
ChatGPT 的運作主要依靠由 A100 或 H100 組成的 DGX 超級電腦,微軟為此花了數億美金採購了上萬張 A100 顯卡組建 Azure 雲計算平台。
為了降低用戶部署大模型的成本,Nvidia推出了 DXG Cloud 服務,每個月 36,999 美元起,你就能獲得一個由 8 張 H100 或 A100 顯卡組成的雲端超級電腦,輕鬆完成高負載的運算工作。
2016 年,老黃親手向 OpenAI 交付了第一台 DGX 超級電腦。7 年之後,頂尖的 AI 算力通過 DXG Cloud 有機會走進每家公司,完成在過去不可能完成的任務。
不難想像,像 ChatGPT 這樣能夠改善人類交流、提高工作效率的先進應用會持續湧現,為我們的生活帶來更多的便利和驚喜。
點石成金,二代 Runway 讓你一句話生成各式大片
再來看到影片製作工具。
在網路上流行一句梗:影片不能 P,所以這是真的。
但如今影片不僅可以 P,還可以從無到有直接用 AI 生成,不用畫師、不用攝影、不用後製。只要你往 Runway 中輸入一段文字,它便還你一段震撼人心的短片。
最早,Runway 是一款後製輔助工具,雖然也借助了人工智慧的神奇力量,但所能實現內容並不復雜,不外乎就是擦除物體、圖像格率修正、去除背景、動態追蹤等,可以將它視作 Adobe Premiere 的傻瓜式外掛。
而當 Runway 打開人工智慧的新大門後,它擁有了點石成金的能力。
在去年 9 月公佈的 Gen 1 版本中,它有了文字轉影片的能力。那時的人們,剛剛見識過文字轉圖片的魔力,而 Runway 直接能生成動態影像,簡直是越級打怪般的震撼。
時隔半年,Runway Gen 2 來了。
比起 Gen 1 模型,它實現了更高的時間一致性和保真度,說人話…..就是畫面之間連接的更順暢了,畫質還更好。
用上 Gen 2,距離隨時隨地生成自己想像的影片又更近了,我們輸入一條不算長的 Prompt:
無人機航空拍攝的山脈。
就這樣!然後 Runway 產生出以下畫面。
再來一個 Prompt 試試看:
午後陽光照進紐約市中一幢公寓的窗戶。
來個進階版,給 Runway 輸入圖片和文字,然後輸入 Prompt 後,產生一段短片。
一個男人走在街上,周圍酒吧的霓虹燈照亮了他
下面這張是原圖。
或者是讓一幅靜態圖片動起來。
還可以將一張無貼圖等待渲染的塑模動畫,直接渲染出動態影像。
Runway 的進步有目共睹,在對抗網路模型這條路上越走越遠、越走越順,如今的 Gen 2 版本已經算是「可看」的程度,雖稱不上精緻,但未來可期。
或許到了 Gen 3 版本,我們就能在它的幫助下,一鍵生成爆紅短影音。到時候,這會是那些 YouTuber 們的惡夢嗎?
突發! Google 開啟 Bard 測試
再來就是最引人注目的一個焦點了。
在大家被 GPT-4 和 Midjourney v5 震撼一週、老黃展望未來 AI 時代的同時,Google 宣布正式開放 Bard 的使用:
請嘗試 Bard,並提供你的感想
根據 Google 的最新展示,相比 ChatGPT,Bard 更像是一個專注於工作學習的隨身助理,你可以在它的協助下,激發想法、滿足好奇心。
你可以讓 Bard 用簡單的語言解釋量子物理學,或者讓它提供腦內風暴,幫你在一年內閱讀 20 本書。
Google 表示,使用者可以在 Bard 的協助下,加速想法、激發好奇心。你可以使用 Bard 提供一些技巧,比如如何實現一年閱讀 20 本書,或者用簡單的語言解釋量子物理學。
在展示內容時,我們還發現了一些細節,Bard 似乎會同時產生多個回答,你可以根據需求選擇最適合你的那一個,並進行持續提問。
當然,ChatGPT 也可以提供多個回答,但它是在回答結束後重新產生,相較來看,Bard 更像是一個會同時提供多種方案的乙方。
可能是 ChatGPT 和 Bing Chat 的負面消息引起了 Google 的重視,後者不斷強調 Bard 目前還只是實驗,Bard 產生的訊息並不代表 Google 的觀點。
Google 表示,雖然 Bard 由大型語言模型提供支援,並會隨著時間推移而日漸強大,但它會學習到一些偏見或者刻板印象,導致它「自信滿滿」地說出一些不準確或者虛假的訊息,比如它會將「ZZ Plant」理解為 Zamioculcas zamioculcas,而不是正確的 Zamioculcas zamiifolia。
有了 Bing Chat「瘋了」的前車之鑑,Bard 的第一個測試版就限制了同一對話中的交流次數,從而保證內容的準確。當你第一次使用 Bard 時,它就會告訴你這只是一個實驗,並期待你的反饋。
作為 Bard 的第一個版本,它暫時還不支援更多語言(包括中文),Google 會持續更新代碼、識別/生成圖片以及多語言支援。
▲ Bard:我不會中文,但希望未來會說
目前,Bard 僅在英國、美國開放使用權限,未來會逐漸擴展到更多國家和地區。
聊天就能做圖,Bing Chat 更進一步
Bing Chat 到底有多熱門,或許從上線一個月就讓 Bing 首次單是使用人次突破 1 億的資料就能說明壹切了。從復雜問題到娛樂聊天,再到靈感創意的實現,Bing Chat 正在重塑我們對網路搜尋的體驗。
現在起,你可以讓 Bing Chat 畫圖了。
微軟為新 Bing 和 Edge 瀏覽器的預覽版更新了三個新功能:Bing Image Creator、人工智慧驅動的 Stories 以及 Knowledge Cards 2.0。其中最重要的當屬可以畫畫的 Bing Image Creator。
微軟表示,人腦處理視覺訊息的速度比文字快約 6 萬倍,Bing 的搜索數據中,圖像是搜索最多的類型之一,而由 DALL·E 模型的高級版本提供支援的 Bing Image Creator,可以讓我們通用自己的語言在 Bing Chat 中描述圖片訊息、選擇藝術風格,Image Creator 就會根據上下文,將你的想像「畫在紙上」。
Bing Image Creator 的加入,讓 Edge 瀏覽器變成了第一個集成人工智慧圖像產生功能的瀏覽器。
由人工智慧驅動的 Stories 和 Knowledge Cards 2.0,可以讓你在搜尋後獲得圖片、短影音以及由人工智慧驅動的訊息圖表,可以一目了然的獲取事實和關鍵訊息。
未來使用 Bing 搜尋時,你獲得的就不是一個個冷冰冰的網頁連結,而是更加豐富、有趣的圖片、影片以及視覺故事。
如果你已經通過新 Bing 申請,現在就可以在 Bing Chat 中體驗 Bing Image Creator 了,如果從下面的連結進去,直接試用。
👉 Bing Image Creator 網頁:請點此
不過這一功能ˋ也只能輸入英文,未來會持續更新。
Adobe Firefly:「友軍中的最強輔助」
當科技公司被牽扯進圖片產生的技術後,著名設計創意公司 Adobe 自然不甘人後。在這個瘋狂的夜晚,Adobe 也推出了自己的創意生成式 AI 模型集:Adobe Firefly。
Adobe 用幾個簡單的例子示範了 Firefly 的能力。你可以用一句話來下指令,例如:
讓正處於春天的風景,變成冬天的模樣。
Firefly 能做的自然不只這些,框選狗狗的毛髮,它可以將毛髮變成畫筆,現場幫狗狗改變髮型;設計一個藝術字,它能幫你生成一個單詞、一句話;設計好一款耳機,Firefly 還能把它放到場景中,變成產品展示圖……
Adobe 認為,AI 正在提供一種打開世界的新方式,設計師可以用最順手的方式來實現創意,「幫助創意人而不是取代創意人」。
同時,Adobe 還創立了「內容真實性倡議」CAI,建立了可信數位內容歸屬的全球標準,並對人工智慧生成的內容進行標記,打造 Firefly 生態系統,「Adobe Firefly 是友軍,更是友軍裡的最強輔助」。
進擊的 AIGC
這一夜裡,我們見證了 AI 領域從服務層到應用層的幾個大突破。
這些出現的更新從側面證明了,AI 領域邁進了一個高速發展的階段。上一個月 AI 可能還畫不好手指,下一個月憑藉算力提升和模型升級,AI 已經能取代掉服裝模特兒的工作。
無數的科幻作品都預言過 AI 在未來會成為我們生活的一部份,但沒有人告訴過我們,我們離這個未來只有咫尺之遙。
我們的生活正在被 AI 一點點地改寫。在 GTC 大會上,黃仁勳提出了一個很有意思觀點,他認為生成式 AI 就是一種新型的電腦,我們可以用人類語言進行程式撰寫、任何人都可以命令電腦來解決問題。
延伸閱讀》
- ChatGPT 有 Mac 版了!MacGPT 不用開瀏覽器就能直接使用
- GPT-4 整合進 Office!微軟推全新 AI 功能 Copilot 的 7 大特點一次看
- GPT-4 馬上玩!用 4 個步驟立刻通過 Bing 機器人的等候申請
- 不用 ChatGPT 外掛!Google 直接把 AI 生成功能加進 Docs、Gmail 裡面
- ChatGPT for Google 超強擴充功能:補充搜尋結果、免開網站就能聊
更多 ChatGPT 相關應用技巧》
- ChatGPT 官方上網外掛終於開放了!這裡告訴你開啟 3 步驟
- ChatGPT Plugins 外掛如何開啟、安裝與使用?完整操作 3 步驟教學
- ChatGPT 對話紀錄如何保存?教你用官方功能下載歷史紀錄
- ChatGPT 聊天紀錄怕不見?教你如何將對話紀錄輸出成 PDF 或是 PNG
- ChatGPT 幫你一鍵整理 Youtube 影片摘要,快速掌握內容重點
- ChatGPT 幫你寫信!直接在 Gmail 裡面就可以完成
- ChatGPT 超多指令的外掛 AIPRM 怎麼用?這裡完整教你
- ChatGPT 變英文口說家教,用 Voice Control for ChatGPT 學英文
- ChatGPT Turbo 版的 Siri 語音助理捷徑,回答更快也更準確
- ChatGPT 的 Mac 版 App!MacGPT 不用開瀏覽器就能直接使用
- ChatGPT 突破時間限制的外掛,終於可以整合 2021 年以後的資料
- ChatGPT 幫你把中國用語翻成台灣習慣的用法
- ChatGPT 在文章的英文、數字和文字間加入空格提高可讀性
- ChatGPT 幫你快速閱讀 PDF 文件,然後回答你 PDF 的內容
- ChatGPT 整合進 Google Docs 裡面,產生的內容直接寫進文件裡
- ChatGPT for Google 超強擴充功能:補充搜尋結果、免開網站就能聊
如果想知道更多關於 Apple 的消息、教學、小技巧或是科技新知,一定要點擊以下任一 LOGO,追蹤我們的 Facebook 粉絲團、加入官方 Line 帳號、訂閱 IG、YouTube 以及 Telegram。