AI 科技

Google Gemini 新功能!現在「看得懂」你在螢幕和鏡頭前做的事啦!

Google Gemini 新功能!

大家是不是也常常有這種時候——手機上打開一堆 App,但搞不清楚哪個功能在幹嘛?或是拿著一個東西想問 AI:「欸,這個到底是什麼?」現在 GoogleGemini 終於幫我們把這一塊補上了!

沒錯!Gemini Live 最新上線的功能,讓 AI 開始學會「看」了!

也就是說,它不只會聽你說話、看你打的字,現在連你手機螢幕上在幹嘛、鏡頭前的東西是什麼,它都能即時幫你看懂、分析、甚至給你建議!超神 ✨

AI 能「看」螢幕是什麼意思?

這次更新之後,有些 Google One AI Premium 的用戶,已經可以搶先體驗到「螢幕即時辨識」的功能。簡單講,你只要開著 Gemini,它就可以看你手機上現在的畫面,幫你解釋內容、回答問題

A short demo of Project Astra (Share screen with Live)
byu/Kien_PS inBard

比如你可能開了一個你不熟悉的 App,畫面上很多按鈕不知道幹嘛的時候,就可以問 Gemini:「這個按鈕的功能是什麼?」

等於說,你手機畫面上發生什麼事,AI 一目了然!

你可以問:「這份報表的重點是什麼?」、「這張圖是誰畫的?」甚至:「這封信裡有什麼我需要注意的地方?」

它就會看著你的畫面,直接回答你!是不是很像你手機裡住了一個超懂科技的朋友😎

鏡頭畫面也能辨識!AI 幫你挑顏色都行

除了螢幕,這次另一個超強更新是——Gemini 現在還可以「看」你相機鏡頭拍到的東西

比方說你手上拿著一個模型作品,想塗上顏色,卻不知道哪個顏色最搭,就可以直接打開鏡頭、問 Gemini:「你覺得我該用什麼顏色好看?」

Google 發佈的官方影片 裡,使用者拿著一個剛上釉的陶器作品,對著 Gemini 說:「我想幫它上色,哪個顏色比較適合?」

然後 AI 就會看著你的作品、分析形狀跟光線,幫你給出建議!根本行動設計顧問來著!

然後 Gemini 透過相機鏡頭即時分析陶器的形狀、表面反光、顏色特性,回答:「像這樣溫潤的粉色陶器,我會推薦深紅色或橄欖綠的搭配,比較能產生對比感。」

Gemini 真的能看著畫面幫你「設計配色」,回話的方式也非常自然,完全不像以前那種呆板機器人。

Gemini 領先開跑!比 Alexa、Siri 更快上線的功能

gemini
Gemini Live,搶先升級。

Google 這波升級真的搶快,因為 Amazon 的 Alexa Plus 還在早期測試、Apple 的新 Siri 傳出延後發布,Google 卻已經讓 Gemini 可以「看見」了!

而且在很多三星手機上,Gemini 早就已經是預設的 AI 助理,根本是 quietly eating everybody’s lunch(默默稱王 😆)。

怎麼用?目前僅開放 Premium 訂閱者使用

目前這個功能只開放給 Google One 的 AI Premium 用戶,也就是有用「Gemini Advanced」版本的用戶。如果你有訂閱,可以去試試看這個新技能是不是已經解鎖!

還沒用到的朋友也不用急,依照 Google 的習慣,這些功能很可能會逐步擴大開放,或是之後整合進更多裝置裡。

小結一下:

  1. Gemini Live 的「即時視覺辨識」功能真的很有感:
  2. 看懂你手機畫面,幫你分析、解說
  3. 看懂你相機拍的東西,直接互動、建議
  4. 對話式互動完全不尷尬,像在跟人聊天一樣自然
  5. 目前限定 Google One AI Premium 訂閱用戶

你會想讓 AI 看你手機畫面,幫你做什麼?留言跟我分享你會拿來做什麼~

我自己最想讓它幫我看我買的家具適不適合家裡擺!

如果你也想試試看,可以到 Google AI Studio 看看有沒有開通喔!

延伸閱讀》

Related Articles