AI 科技新聞

Google 推出 Gemini 3.5 Live Translate!支援 70 多種語言,跨語言通話更接近即時對話

Google 在美國時間 6 月 9 日發表全新語音模型 Gemini 3.5 Live Translate,主打可在超過 70 種語言之間進行接近即時的語音對語音翻譯。和過去常見的翻譯工具不同,新模型不只負責把內容翻成另一種語言,還會盡量保留原始講者的語調、語速與音高,讓跨語言通話聽起來更接近自然對話。

Gemini 3.5 Live Translate

這項功能即日起將陸續導入 Google 翻譯、Google Meet,也會透過 Gemini Live API 開放給開發者使用。對常需要跨語言開會、通話、教學或出國溝通的人來說,即時翻譯不再只是「聽懂大意」,而是更接近雙方可以順暢對話的工具。

不用手動選語言,系統可自動辨識 70 多種語言

Google 表示,Gemini 3.5 Live Translate 可自動辨識使用者正在說的語言,不需要像傳統翻譯工具一樣事先手動設定來源語言與目標語言。

更棒的是,Gemini 3.5 Live Translate 新模型可直接處理串流語音輸入,也就是講者說話的同時,系統會持續接收語音內容並產生翻譯結果。這和過去許多語音翻譯系統需要等使用者說完整句話後,才開始翻譯的方式不同。

這樣未來就可以透過 Gemini 3.5 Live Translate 達到會議上的即時翻譯效果,不需要等對方一整段完整講完以後才可以將轉錄的內容進行翻譯,方便很多。

Gemini 3.5 Live Translate 即時翻譯效果實測

如果你也想要測試 Gemini 3.5 Live Translate 的即時翻譯效果,可以用 Chrome 開啟下面 Google Studio AI 頁面,來測試。

實作的方法如下:

  1. 用 Chrome 開啟 Gemini 3.5 Live Translate 測試頁,右側選擇 Chinese Traditional
    Gemini 3.5 Live Translate
  2. 另外用一個分頁開啟 YouTube 找一個外語的影片
  3. 回到 Gemini 3.5 Live Translate 測試頁
  4. 選擇下方右邊的螢幕按鈕,設定你剛剛開啟的 YouTube 分頁
    Gemini 3.5 Live Translate
  5. 開始播放 YT 影片後,你就可以看到上方逐一顯示 Gemini 3.5 Live Translate 錄製的原文以及翻譯的內容,同時影片還在持續說話,表示對方不用中斷對話,你也可以持續收到翻譯的內容。

Gemini 3.5 Live Translate

我自己實測下來的感覺其實還不錯,大約會有 3、5 秒的延遲,但這對於即時翻譯來說其實算是很正常的,

保留語調、語速與音高,讓翻譯聲音更自然

這次 Gemini 3.5 Live Translate 的另一個重點,是翻譯時會保留原始講者的語調、語速與音高。

過去許多語音翻譯服務雖然能正確翻譯文字內容,但輸出的聲音往往像制式朗讀,少了原本說話者的情緒與語氣。Google 這次強調,新模型希望讓翻譯後的語音更接近原本講者的表達方式。

這對跨語言通話、線上會議、教學、直播與現場口譯都會有幫助。舉例來說,在會議中,講者的語氣可能會影響聽者理解重點;在教學或直播情境中,語速與語調也會影響內容是否容易吸收。

Google Meet 將升級,從 5 種語言擴大到 70 多種語言

Google Meet 也會改採 Gemini 3.5 Live Translate 作為語音翻譯核心。

Google 表示,先前 Google Meet 的語音翻譯功能僅支援 5 種語言,而新版本將擴大到 70 多種語言,並支援超過 2,000 種語言組合。這對跨國團隊、海外客戶會議、遠距教學與國際活動來說,會讓使用門檻明顯降低。

此外,Google 也提到新版介面將提供更快速的翻譯啟用方式,讓使用者在會議中更容易開啟語音翻譯,不必花太多時間設定。

Google 翻譯 App 連接耳機後,可進行雙向即時語音翻譯

Gemini 3.5 Live Translate 的技術源頭,可追溯到 Pixel Buds 耳機上的即時翻譯功能。早期這項功能需要搭配 Pixel 手機與 Google Translate 使用,後來 Google 在 2025 年底將即時翻譯功能擴大到所有耳機裝置。

這次推出 Gemini 3.5 Live Translate,則是進一步以新的 Gemini 音訊模型強化既有的即時語音翻譯能力。

對一般使用者來說,最直接的使用方式會是透過 Google 翻譯 App。只要連接耳機,就能進行雙向即時語音翻譯,適合用在旅行、問路、叫車、購物或面對面溝通等情境。

開發者可透過 Gemini Live API 建立即時語音翻譯服務

除了 Google 自家產品,開發者也能透過 Gemini Live API 使用這項能力。

Google 表示,開發者可以搭配 Agora、LiveKit、Pipecat 等即時媒體平台,快速建置語音翻譯應用。這代表未來不只 Google Meet 或 Google 翻譯 App 能使用類似功能,其他通訊、客服、直播、線上教育或交通服務,也有機會整合近即時跨語言語音翻譯。

目前叫車平台 Grab 已經測試使用這個模型,讓司機與乘客在接送過程中進行接近即時的跨語言溝通。這類場景很貼近日常需求,因為雙方通常不需要長篇翻譯,只需要快速確認地點、路線、等待位置或付款問題。

延伸閱讀》

AirPods 即時翻譯怎麼用?真的好用嗎?支援型號、教學與測試結果分享

Apple Intelligence 即時翻譯技巧:訊息、通話一鍵自動翻譯,跨國互動更輕鬆

Google 即時翻譯正式導入 iOS!不挑設備,戴上耳機就能聽懂超過 70 種語言

Google 翻譯導入 Gemini 助力!不只能精準理解語意,也跟進「耳機即時翻譯」功能

如果想知道更多關於 Apple 的消息、教學、小技巧或是科技新知,一定要點擊以下任一 LOGO,追蹤我們的 Facebook 粉絲團、訂閱 IG、YouTube 以及 Telegram。

加入LINE好友  追蹤FB粉絲團  追蹤 Instagram  訂閱 YouTube  訂閱 Telegram

Related Articles