
大家是不是也常常有這種時候——手機上打開一堆 App,但搞不清楚哪個功能在幹嘛?或是拿著一個東西想問 AI:「欸,這個到底是什麼?」現在 Google 的 Gemini 終於幫我們把這一塊補上了!
沒錯!Gemini Live 最新上線的功能,讓 AI 開始學會「看」了!
也就是說,它不只會聽你說話、看你打的字,現在連你手機螢幕上在幹嘛、鏡頭前的東西是什麼,它都能即時幫你看懂、分析、甚至給你建議!超神 ✨
AI 能「看」螢幕是什麼意思?
這次更新之後,有些 Google One AI Premium 的用戶,已經可以搶先體驗到「螢幕即時辨識」的功能。簡單講,你只要開著 Gemini,它就可以看你手機上現在的畫面,幫你解釋內容、回答問題。
A short demo of Project Astra (Share screen with Live)
byu/Kien_PS inBard
比如你可能開了一個你不熟悉的 App,畫面上很多按鈕不知道幹嘛的時候,就可以問 Gemini:「這個按鈕的功能是什麼?」
等於說,你手機畫面上發生什麼事,AI 一目了然!
你可以問:「這份報表的重點是什麼?」、「這張圖是誰畫的?」甚至:「這封信裡有什麼我需要注意的地方?」
它就會看著你的畫面,直接回答你!是不是很像你手機裡住了一個超懂科技的朋友😎
鏡頭畫面也能辨識!AI 幫你挑顏色都行
除了螢幕,這次另一個超強更新是——Gemini 現在還可以「看」你相機鏡頭拍到的東西!
比方說你手上拿著一個模型作品,想塗上顏色,卻不知道哪個顏色最搭,就可以直接打開鏡頭、問 Gemini:「你覺得我該用什麼顏色好看?」
在 Google 發佈的官方影片 裡,使用者拿著一個剛上釉的陶器作品,對著 Gemini 說:「我想幫它上色,哪個顏色比較適合?」
然後 AI 就會看著你的作品、分析形狀跟光線,幫你給出建議!根本行動設計顧問來著!
然後 Gemini 透過相機鏡頭即時分析陶器的形狀、表面反光、顏色特性,回答:「像這樣溫潤的粉色陶器,我會推薦深紅色或橄欖綠的搭配,比較能產生對比感。」
Gemini 真的能看著畫面幫你「設計配色」,回話的方式也非常自然,完全不像以前那種呆板機器人。
Gemini 領先開跑!比 Alexa、Siri 更快上線的功能

而且在很多三星手機上,Gemini 早就已經是預設的 AI 助理,根本是 quietly eating everybody’s lunch(默默稱王 😆)。
怎麼用?目前僅開放 Premium 訂閱者使用
目前這個功能只開放給 Google One 的 AI Premium 用戶,也就是有用「Gemini Advanced」版本的用戶。如果你有訂閱,可以去試試看這個新技能是不是已經解鎖!
還沒用到的朋友也不用急,依照 Google 的習慣,這些功能很可能會逐步擴大開放,或是之後整合進更多裝置裡。
小結一下:
- Gemini Live 的「即時視覺辨識」功能真的很有感:
- 看懂你手機畫面,幫你分析、解說
- 看懂你相機拍的東西,直接互動、建議
- 對話式互動完全不尷尬,像在跟人聊天一樣自然
- 目前限定 Google One AI Premium 訂閱用戶
你會想讓 AI 看你手機畫面,幫你做什麼?留言跟我分享你會拿來做什麼~
我自己最想讓它幫我看我買的家具適不適合家裡擺!
如果你也想試試看,可以到 Google AI Studio 看看有沒有開通喔!
- 現在有一個月免費試用版:由此去體驗
延伸閱讀》















