ChatGPT 高階語音模型可以用了!回應更自然、還能即時口譯、辨識畫面


line banner

ChatGPT GPT-4o 高階語音模型

OpenAI 在 5 月發表了 ChatGPT 新的高階語音模型,不僅回應速度更快、更即時,還可以當作即時口譯、可以判斷語氣聲調、甚至可以唱歌,但是這個高階語音模型一直沒有正式推出,直到近日終於要開始推送給 ChatGPT Plus 的使用者了。

可以使用的話會收到通知信

根據外媒的報導,OpenAI 最近開始針對 ChatGPT Plus 付費會員推送 ChatGPT 高階語音模型,但並非一次全部開放,而是逐步推送。

如果你是 ChatGPT Plus 會員並且想知道自己到底可不可以使用高階語音模型的話,除了可以自行點開 ChatGPT App 來測試看看以外,你還會收到一封通知信;有收到這封通知信就表示你已經可以使用 ChatGPT 高階語音模型的功能。

ChatGPT GPT-4o 高階語音模型

目前的 ChatGPT 雖然也可以語音對談,但是對談的結果最後會以文字對話的方式顯示,但是新版的似乎不會,所以如果你直接使用 ChatGPT 然後啟動語音對話功能後,發現最後沒有顯示文字的對話結果,那也表示你已經可以使用新的 ChatGPT 高階語音模型。

所有 Plus 會員在秋天都能用

雖然現在是逐步針對 ChatGPT Plus 會員推送高階語音模型的功能,但是 OpenAI 也有提到預計在今年秋季的時候開放所有的 ChatGPT Plus 會員使用。

至於是秋季的什麼時候目前還不確定。

ChatGPT 高階語音模型可以做什麼?

ChatGPT 高階語音模型和目前的語音功能最大差別之一就是在流暢度,互動的時候你會覺得好像真的在和真人對話一樣。

即時語音翻譯

OpenAI 在發表會上還有示範讓 GPT-4o 當成即時翻譯機,它會用很口語化的方式在英文與不同語言之間做即時翻譯,而且不是很死板的完全照翻,會真的很像有一個朋友在幫你和外語者溝通那樣。

辨識聲音語調

ChatGPT 高階語音功能除了即時翻譯以外,還能夠理解和表達多種情緒, 並且生成多種情感表達的聲音。OpenAI 當時發表這項功能時,也展示了 GPT-4o 聽完一個笑話後也會像是正常人一樣的笑,而且是很自然的那種感覺。

讓 ChatGPT 作曲唱歌

你可以下指令給 ChatGPT,然後要求 ChatGPT 按照指令唱出旋律,中途還可以調整聲音語調、唱歌口氣的輕重,這些在 GPT-4o 模型下的 ChatGPT 高階語音模型下都可以做到。

還有視訊與畫面識別功能

當時 ChatGPT 在發布高階語音功能的同時,還有提到新版的 GPT-4o 還可以透過視訊辨識鏡頭所拍攝到的畫面,ChatGPT 可以看得出來兩個在猜拳的人誰輸誰贏。

還可以共享螢幕畫面,讓 ChatGPT 去分析你畫面上的內容,並進行更深入的互動。

就像有國外的網友在玩日本字幕的神奇寶貝遊戲時,一邊玩一邊把畫面拿給 ChatGPT 看,讓 ChatGPT 幫忙翻譯畫面上顯示的內容。

如果你是 ChatGPT Plus 會員,希望可以早日體驗新版的語音模型,可以注意一下自己的信箱是不是有收到 OpenAI 寄來的通知信。

延伸閱讀》

GPT-4o 的語音即時對談怎麼啟用?這裡告訴你

OpenAI 最新 GPT-4o 有哪些好用功能?這裡一次幫你彙整

OpenAI 推出 GPT-4o mini 模型:性能更好、應用更廣泛,免費帳戶也能無限用

如果想知道更多關於 Apple 的消息、教學、小技巧或是科技新知,一定要點擊以下任一 LOGO,追蹤我們的 Facebook 粉絲團、加入官方 Line 帳號、訂閱 IG、YouTube 以及 Telegram。

加入LINE好友  追蹤FB粉絲團  追蹤 Instagram  訂閱 YouTube  訂閱 Telegram