모델출시 2026-04-22 일반

OpenAI, 'ChatGPT Images 2.0' 공개 — 2K 해상도·글자 정확도 99%에 '생각하는' 모드 추가

OpenAI, ‘ChatGPT Images 2.0’ 공개 — 2K 해상도·글자 정확도 99%에 ‘생각하는’ 모드 추가

OpenAI가 2026년 4월 21일, 이미지 생성 모델의 후속 버전인 ChatGPT Images 2.0(내부 이름 GPT-Image-2)을 라이브스트림과 함께 공개했다. 이번 업데이트의 핵심은 세 가지다. 최대 4096×4096(2K) 해상도, 표준 타이포그래피 벤치마크 기준 99% 텍스트 정확도, 그리고 멀티모달 모델{{multimodal-model}}에 추론 예산{{thinking-budget}} 개념을 끼얹은 “Thinking” 모드다.

무엇이 바뀌었나

이전 버전과 비교해 가장 눈에 띄는 건 이미지 안의 글자 렌더링이다. Startup Fortune은 OpenAI가 “표준 타이포그래피 벤치마크에서 99%에 근접한 정확도”를 주장했다고 보도했다. 라틴 문자뿐 아니라 한·중·일(CJK) 문자도 대상이다. 간판, 제품 라벨, UI 목업, 손글씨까지 “글자다운 글자”가 나온다는 설명이다. 이 주장은 아직 외부 독립 벤치마크로 검증되지는 않았다.

속도와 규모도 올라갔다. 한 번에 최대 8장까지 생성 가능하고, 기본 출력이 4096×4096으로 커졌다. OpenAI는 이전 세대 대비 생성 속도가 약 2배 빨라졌다고 밝혔다.

항목	이전(ChatGPT Images 1)	ChatGPT Images 2.0
최대 해상도	1024×1024 중심	최대 4096×4096 (2K)
동시 생성	최대 4장	최대 8장
텍스트 정확도	일부 오탈자 빈발	표준 벤치마크 99% 주장
생성 속도	기준	약 2배
모드	단일	Instant + Thinking

자료: Axios, Interesting Engineering, Startup Fortune (2026-04-21). 속도·정확도는 OpenAI 자체 수치.

‘Thinking’ 모드는 왜 추가됐나

Instant는 이름 그대로 빠른 생성에 초점을 맞춘 기본 모드고, Thinking 모드는 렌더링 전에 모델이 구도·타이포·색상 조합을 더 오래 고민하도록 설계됐다. 텍스트 LLM에서 성공한 추론 예산{{thinking-budget}} 개념이 이미지 생성으로 확장된 형태로 볼 수 있다. 디자인 목업처럼 “첫 시도에서 정확히 나와야 하는” 작업이 주요 타깃이다.

라이브 시연에서는 매거진 스타일의 레이아웃, 정확한 제품 라벨이 들어간 패키지 목업, 다국어 포스터 등이 예시로 등장했다. Axios는 OpenAI가 이번 업데이트를 “이미지 생성이 장난감에서 업무 도구로 옮겨가는 전환점”이라는 프레이밍으로 내세웠다고 전했다.

배포 일정

공개 당일인 4월 21일부터 ChatGPT Plus, Team, Enterprise 가입자 대상으로 단계적 롤아웃이 시작됐다. Free·일반 사용자에 대한 확대 일정은 발표되지 않았다. API 접근은 5월 초 예정이며, 서드파티 인퍼런스 플랫폼 fal은 같은 날 자사 엔터프라이즈 API에서 GPT-Image-2를 지원한다고 별도 보도자료를 냈다. OpenAI 밖에서도 바로 붙여 쓸 수 있는 통로가 열렸다는 뜻이다.

긍정적으로 보는 입장

Interesting Engineering은 이번 업데이트를 “이미지 생성에서 ‘컨텍스트 이해’가 품질 결정 변수로 바뀌는 신호”라고 평했다. 프롬프트를 단순히 렌더링하는 것이 아니라 의미를 파악해 화면을 구성한다는 점에서, 마케팅·디자인·프로토타이핑 현장의 반복 작업 시간이 줄어들 여지가 있다는 해석이다. 텍스트 정확도가 실제로 99%에 근접한다면, 지금까지 Canva·Figma·어도비 파이어플라이로 나눠져 있던 이미지 제작 파이프라인이 ChatGPT 하나로 상당 부분 수렴할 수 있다.

비판적 관점·우려

Gizmodo는 같은 날 공개된 분석 기사에서 “업계가 이미 AI 슬롭{{ai-slop}}(저품질 생성 콘텐츠 범람) 문제를 심각하게 다루고 있는 시점에, 더 빠르고 정교한 이미지 생성기는 잘못된 용도로 쓰일 때 문제를 더 키운다”고 지적했다. 타이포그래피 정확도 99%라는 수치는 가짜 영수증, 위조 간판, 사칭 로고를 만드는 데도 똑같이 유용하기 때문이다.

앞으로 지켜볼 지점

텍스트 정확도 99% 수치가 외부 벤치마크(예: GenAI-Bench, ImageNet-Text 류)에서 재현되는지
API 5월 초 공개 시 가격 구조 — 해상도·Thinking 모드별 과금이 세분화될지, 경쟁 모델(Google Imagen 5, Midjourney v8)과 가격 경쟁이 어떻게 전개될지
한국어 텍스트 렌더링 품질. OpenAI 발표 예시에는 CJK가 포함됐지만, 실제 한글 레이아웃 정확도는 Nano Banana Pro·Ideogram 3.0 등 기존 강자와 비교 필요

이번 공개가 의미 있는 건 “이미지 생성이 어떻게 좋아졌는가”가 아니라 “누가 이걸 업무 도구로 쓰게 될 것인가”라는 질문이 구체화됐다는 점이다. Plus·Team·Enterprise 우선 배포라는 순서 자체가 OpenAI가 어떤 시장을 먼저 잡으려 하는지 드러낸다.

출처 및 참고 자료

Images in ChatGPT are getting a major update — Axios, 2026-04-21
ChatGPT Images 2.0 debuts with reasoning-driven generation, 2K output — Interesting Engineering, 2026-04-21
OpenAI launches GPT-Image-2 with near-perfect text rendering and twice the speed of its predecessor — Startup Fortune, 2026-04-21
fal Launches An Enterprise API for GPT Image 2 by OpenAI — fal 보도자료 (EIN Presswire), 2026-04-21