AI 科技ChatGPT 應用新聞

OpenAI 推出 ChatGPT Images 2.0 生圖模型!文字更清晰、指令更準,五大升級亮點一次看

沉寂一段時間的 OpenAI,今日(4/22)正式推出新一代生圖模型 ChatGPT Images 2.0;這次升級不只是讓圖片更好看,而是強化了文字呈現、指令理解、多語言生成與構圖能力,過去常見的文字模糊、細節跑掉與排版不自然等問題,都有明顯改善。而且在 thinking 模式下,還能進一步整合推理、多圖生成與資訊整理能力。

OpenAI 甚至號稱 ChatGPT Images 2.0 不只是單純的畫圖工具,而是更接近一套能實際協助設計、教學與內容製作的視覺生成系統;即日起同步開放所有用戶使用,最近有生圖需求不妨來試試看!

OpenAI ChatGPT ChatGPT Images 2.0

ChatGPT Images 2.0 五大升級特色一次看

1. 指令理解更精準、生成細節也更豐富

ChatGPT Images 2.0 最大的改變是對指令的理解能力大幅提升。無論是物件位置、彼此關係,還是畫面中的細節元素,都能精準呈現。過去常見「大致符合但細節跑掉」的情況明顯減少,像是小字、圖示、UI 元件與複雜構圖,都能穩定生成,讓產出的圖片更接近可直接使用的程度。

OpenAI ChatGPT ChatGPT Images 2.0
👆🏻ChatGPT Images 2.0 生成的 macOS 截圖

2. 文字生成能力升級,字體清晰自然

ChatGPT Images 2.0 也補強了 AI 生圖最容易出錯的「文字」,包括英文、中文、日文、韓文等非拉丁語系都有更清晰的生成表現;即便是複雜密集的文字排版,ChatGPT Images 2.0 也能輕鬆應付。

重點是 ChatGPT Images 2.0 不只把字「畫對」,也能讓整體語句更通順、排版更自然,適合應用在海報、圖解、漫畫或社群圖片等需要大量文字的場景。

OpenAI ChatGPT ChatGPT Images 2.0

3. 風格呈現更到位,從寫實到漫畫風都 ok

在視覺風格方面,ChatGPT Images 2.0 也有明顯進步;無論是寫實照片、電影感畫面、像素風還是漫畫風,都能準確掌握風格特徵,生成結果不再只是接近某種風格,而是更貼近實際媒材的表現。

OpenAI ChatGPT ChatGPT Images 2.0

4. thinking 模式支援多圖生成與推理

當用戶使用 thinking 模式時,ChatGPT Images 2.0 的能力會更上一層樓。能夠在生成圖片前先進行推理與規劃,甚至一次產出多張不同方向的圖像,並維持角色與物件的一致性。讓用戶可以從單一構想延伸出完整的一組視覺內容,例如一系列海報、漫畫分鏡或設計提案。

OpenAI ChatGPT ChatGPT Images 2.0

5. 支援更多畫面比例選項、涵蓋知識也更廣

除了上述幾項核心升級外,ChatGPT Images 2.0 在實際應用中有三個細節值得留意。

首先是在畫面比例上,支援從橫向 3:1 到直向 1:3 的輸出格式,讓生成圖片可以更直接套用在簡報、海報、社群貼文或行動裝置畫面中,減少後續裁切與調整的需求。

OpenAI ChatGPT ChatGPT Images 2.0

ChatGPT Images 2.0 也具備截至 2025 年底的世界知識,可提供更貼近現實且相對準確的生圖需求,對需要資訊正確性的應用場景特別有幫助。

OpenAI ChatGPT ChatGPT Images 2.0

此外,OpenAI 也透過 API(gpt-image-2)開放這些能力,開發者能將生圖功能整合進產品與服務中,例如用於在地化廣告素材、教學圖生成、設計工具或網站內容製作等,進一步擴大 AI 生圖在實務上的應用範圍。

ChatGPT Images 2.0 與 Gemini 生圖能力比較

至於 ChatGPT Images 2.0 實際表現如何?我這邊設計幾個指令來跟 Gemini 作比較,大家可以參考看看。

範例一:海報宣傳圖生成

指令:

做成一張日式風格的宣傳圖

原圖:

OpenAI ChatGPT ChatGPT Images 2.0

ChatGPT Images 2.0 與 Gemini 的生成結果:

OpenAI ChatGPT ChatGPT Images 2.0

範例二:情境圖片生成

指令:

生成一張俯視角的木桌場景照片,風格寫實自然,像高品質商業攝影。桌上必須準確擺放以下物件,位置不能出錯:

* 左上角:一杯有拉花的熱拿鐵
* 右上角:一副黑框眼鏡,鏡腳打開
* 正中央:一台打開的銀色筆電,畫面顯示簡潔的圖片生成軟體介面
* 筆電左側:一本封面是深藍色的筆記本,上面放一支白色原子筆
* 筆電右側:一台黑色智慧型手機,螢幕朝上
* 左下角:三張 Polaroid 風格的小照片,彼此稍微重疊
* 右下角:一個小型綠色盆栽

額外要求:

* 所有物件都不能互相遮住關鍵部位
* 桌面保留適當留白,構圖要平衡
* 光線從左側照進來,形成自然陰影
* 整張圖不可多出額外物件
* 比例必須自然,不能有物件大小明顯失真

ChatGPT Images 2.0 與 Gemini 的生成結果:

OpenAI ChatGPT ChatGPT Images 2.0

範例三:漫畫風格圖像生成

指令:

畫一張日系漫畫風插圖:一位年輕工程師坐在桌前使用筆電,畫面從側面視角呈現,桌上有咖啡、筆記本與手機,背景是簡潔的工作室環境。整體風格乾淨、線條俐落,光影柔和,帶有一點溫暖的日常氛圍。

ChatGPT Images 2.0 與 Gemini 的生成結果:

OpenAI ChatGPT ChatGPT Images 2.0

範例四:擬真風格生成

指令:

一張擬真風格的隨手旅行照片:一個人站在陰天早晨的海岸公路停車觀景點,畫面以 35mm 底片拍攝。構圖自然略帶不完美,可見顆粒感,採用環境光線與低飽和色彩,人物的衣物與頭髮被風吹動,呈現電影感的真實氛圍,帶有生活紀錄片般的質感。

ChatGPT Images 2.0 與 Gemini 的生成結果:

OpenAI ChatGPT ChatGPT Images 2.0

範例五:複雜文字海報生成

指令:

設計一張繁體中文洗手教學海報,標題為「正確洗手 5 步驟」,內容包含沖濕雙手、塗抹肥皂、搓洗手心手背與指縫、清水沖淨、擦乾雙手。風格簡潔清楚,像學校衛教海報,文字要清晰可讀。

ChatGPT Images 2.0 與 Gemini 的生成結果:

OpenAI ChatGPT ChatGPT Images 2.0

ChatGPT Images 2.0 即日起開放所有用戶使用

ChatGPT Images 2.0 目前已正式上線,開放所有 ChatGPT 用戶使用(免費帳戶也 ok);若使用 Plus、Pro 或 Business 方案,還可進一步體驗 thinking 模式,發揮更完整的推理與多圖生成能力。

從上面的比較應該也能感受到 ChatGPT Images 2.0 在文字渲染、排版設計、細節處理、複雜畫面都能跟 Gemini 的 Nano Banana 2 打得有來有回;尤其是在需要大量文字、清楚結構或資訊層級的場景中,ChatGPT Images 2.0 的略勝一籌,也更接近可直接使用的程度,推薦大家自己玩玩看,感受一下!

延伸閱讀》

如果想知道更多關於 Apple 的消息、教學、小技巧或是科技新知,一定要點擊以下任一 LOGO,追蹤我們的 Facebook 粉絲團、訂閱 IG、YouTube 以及 Telegram。

加入LINE好友  追蹤FB粉絲團  追蹤 Instagram  訂閱 YouTube  訂閱 Telegram

Related Articles