不只是靜態的圖片!蘋果最新 AI 模型幫你把文字轉動畫


line banner

Apple 大型語言模型 AI

現在很多人都在用 bingMidjourney 這類的 AI 工具創作圖像,而 Apple 也被認為在今年會推出更針對 AI 相關的功能。在上週就有外媒報導,蘋果發布了一項名為「MGIE」的開源 AI 模型,甚至透過 AI 讓文字轉變成動畫。

Apple 研究員發表 AI 開源模型

蘋果的研究人員上週釋出了一個新的開源 AI 智慧模型,能夠根據使用者的自然語言指令(透過VentureBeat)來處理影像工作。

可以做的內容包含了影像的顏色調整、對比度調整、更改照片風格….等,甚至是要去被、要做大小的裁切,透過 Apple 的 MGIE 模型都能夠處理。

例如給它一張披薩的照片,然後跟它說要讓披薩看起來健康一點,他就會在披薩上加上一些綠色蔬菜,畢竟有菜就是被認為是比較健康的感覺。

Apple 大型語言模型 AI

或是社要把天空從白雲換成閃電、要移除背景的雜物、要調整亮度或是在一份甜甜圈上加莓果醬,Apple 的 MGIE 模型都可以做到。

Apple 大型語言模型 AI

利用文字生成動態影像

與此同時,蘋果也推出了一種名為「Keyframer」的新工具,只要輸入自然語言(就是我們一般說話的方式)就可以生成動態的影像。

在蘋果這份報告中展示了兩個範例,其中一個是讓太空中的星星閃爍,星球周圍的光暈也要有所變化;另一個則是太空火箭要不斷的上升,所以背景的月亮和雲會往下降。

Apple 大型語言模型 AI

雖然這些圖片都可以在現有的 AI 工具上一張一張生成,但是因為每次生成的結果可能都會不同,接在一起可能很不順暢,但是 Apple 的開發人員是透過他們開發的工具搭配 AI 語言模型,讓這些圖片可以在一個指令下就生成。

Apple 大型語言模型 AI

另外,這次發表的內容是蘋果的開發人員與加州大學研究人員合作完成,並在國際學術會議上發表的相關成果。

而且上面的功能未必會直接在 Apple 產品中讓大家使用,我覺得比較蘋果的做法應該是把這個功能與技術融合在其他的應用中。

分析師預估蘋果 2024 年將會有比較大的 AI 進展

雖然蘋果過去都強調他們一直有在使用 AI,並且已經落實在 iPhone 的各項功能中,包含照片的處理、根據對應時間與情況顯示不同的 Widget 小工具、Homekit 相關應用….等,但是這些都是比較隱性的,相較於 ChatGPT、Bing 以及 Google Gemini(之前的 Bard)來說,使用者比較不會有「真的在使用 AI 工具」的感覺。

而預計在 iOS 18 和 iPadOS 18 推出後,蘋果也會推出類似 ChatGPT 的生成式 AI 功能,並且加入到 Siri 中,讓 Siri 進化成 Siri 2.0,這個最快應該可以在今年 6 月的 WWDC 上看到,大家就期待看看吧。

延伸閱讀》

如果想知道更多關於 Apple 的消息、教學、小技巧或是科技新知,一定要點擊以下任一 LOGO,追蹤我們的 Facebook 粉絲團、加入官方 Line 帳號、訂閱 IG、YouTube 以及 Telegram。

加入LINE好友  追蹤FB粉絲團  追蹤 Instagram  訂閱 YouTube  訂閱 Telegram