
OpenAI 近期正式將 GPT-4o 模型應用於 ChatGPT 的圖像生成功能。GPT-4o 是以以大量圖文資料訓練的多模態模型,不僅有強大的圖像理解與生成能力,還能依照自然語言的描述,精準掌握細節與情境脈絡進行創作。
甚至連繁體中文字的生成也幾乎都沒問題,不會像過去生成不知道是什麼的象形文字。
而且 OpenAI 也宣布免費使用者也能使用,只是目前還沒開放。
GPT-4o 圖像生成:很好玩,但並非唯一可用
GPT-4o 圖像生成推出後我也做了一些測試,先説説結論:
『很好玩,而且使用性非常高,也確實有不少細節,但不是最完美的』
GPT-4o 確實可以生成許多過去無法生成的內容,而且無論是從描述生成或是從另外一張圖像去二創,效果都非常不錯,甚至連繁體中文字都可以生成,即便偶爾還是有錯,但是完整率大概 98% 了,不像過去幾乎都是看不懂的象形符號。
當然 GPT-4o 圖像生成還是有些沒辦法達到的地方,甚至我跟 Grok 3 相比,在部分比較上還是有遜色的地方。下面我實際帶大家來看看我用 GPT-4o 做了哪些東西。
GPT-4o 圖像生成實測
把 Q 版貼圖生成真人版

ChatGPT 會先分析圖像的內容後,然後可能會確認幾件事後,生成了如下的版本,大家覺得如何呢?

把卡通人物生成真人版
我自己覺得生成效果意外的不錯,該有的元素都有到位,連旁邊的「不客氣」三個字都非常正確。
然後我丟了一張白雪公主的圖片,並跟他說了一下這是白雪公主的圖片,請他生成真人版的樣子。

結果他跟我說這個有版權問題,不能直接幫我處理。於是我改了一個說法,不說這是白雪公主,直接丟圖片然後請他生成真人版的樣子,這樣反而就可以了。
下面這是迪士尼的真人版白雪公主,大家覺得呢?

把迷因圖漫畫化
再來我丟了一張迷因圖給 ChatGPT,這次要他從真人版改成日本漫畫的版本,結果如下。

我覺得畫的也是蠻傳神的。
老照片上色
我找了一張黑白照片請 GPT-4o 幫我上色。


我還請他幫我生成一張沒有鬍子的版本,結果長這樣。

生成 iPhone 傳聞照片
接著我給他一段描述的文字,想說看看能不能生成類似 iPhone 模型機的圖片,結果變成這樣 😂😂

老實說 iPhone 17 Air 那張我覺得是不錯的,只是鏡頭模組不太對而已,但是 iPhone 17 Pro 的就差蠻多了。
後來我就直接給他之前外流的 CAD 圖檔,讓他有更直接的圖像可以參考。

下面這是他生成的結果。

老實說這張的結果跟我想要的其實差不多了,但是鏡頭的處理上還是沒有很正確。我心裡想的是《iPhone 17 Air 到底有多薄?這張對比圖看完太衝擊了!》這篇文章裡面比較 iPhone 17 Air 與 iPhoen 17 Pro 那張圖片的樣子。
從古代照片還原真人版
再來再來,我們來還原一下古代人的樣子。
我找了康熙皇帝、雍正皇帝的畫像,然後請 GPT-4o 來還原。

下面這張是維基百科裡面雍正皇帝的畫像。

生成的結果有點胖,我請他改瘦一點,然後找了兩句雍正皇帝的名言請他加入。

這裡我也比較了一下 Grok 3 的生成結果。
Grok 3 沒有生成全身的照片給我,但是臉部細節非常多。

把圖片生成樂高版
再來,我讓 ChatGPT 把一張魔戒電影的劇情畫面做成樂高版本,效果也是相當不錯。


甚至請他生成樂高的包裝,也完全沒問題,而且把樂高包裝的特色完整呈現。

但如果請他把文字改成繁體中文版的話,整個包裝會變得有點簡陋,而且仔細看地板也不是樂高的板子,大象也不是用一塊塊積木拼成的 😂

如果比較一下 Gemini 和 Grok 的話,Grok 生成的結果是這樣:

Gemini 的結果是這樣:

不想上班就直接說嘛……
生成詩詞文字
這次我給他一段詩詞,要他生成具有水墨畫背景的圖像。

像這樣多個文字的處理也可以,但有時候不是一次就可以到位,而且如果要他生成繁體版的話,可能文字太多了會出錯。

生成早安圖
這是 GPT-4o 的版本,非常到位:

這是 Grok 3 的版本:

這些實測跟大家分享,如果你是 ChatGPT Plus 訂閱的使用者,現在就可以使用 GPT-4o 的圖像生成功能,蠻好玩的可以去試試看。OpenAI 說免費版 ChatGPT 使用者也可以用,但是目前還沒有開放。
延伸閱讀》
如果想知道更多關於 Apple 的消息、教學、小技巧或是科技新知,一定要點擊以下任一 LOGO,追蹤我們的 Facebook 粉絲團、訂閱 IG、YouTube 以及 Telegram。




























