OpenAI, 'ChatGPT Images 2.0' 공개 — 2K 해상도·글자 정확도 99%에 '생각하는' 모드 추가

OpenAI, ‘ChatGPT Images 2.0’ 공개 — 2K 해상도·글자 정확도 99%에 ‘생각하는’ 모드 추가

OpenAI가 2026년 4월 21일, 이미지 생성 모델의 후속 버전인 ChatGPT Images 2.0(내부 이름 GPT-Image-2)을 라이브스트림과 함께 공개했다. 이번 업데이트의 핵심은 세 가지다. 최대 4096×4096(2K) 해상도, 표준 타이포그래피 벤치마크 기준 99% 텍스트 정확도, 그리고 멀티모달 모델{{multimodal-model}}에 추론 예산{{thinking-budget}} 개념을 끼얹은 “Thinking” 모드다.

무엇이 바뀌었나

이전 버전과 비교해 가장 눈에 띄는 건 이미지 안의 글자 렌더링이다. Startup Fortune은 OpenAI가 “표준 타이포그래피 벤치마크에서 99%에 근접한 정확도”를 주장했다고 보도했다. 라틴 문자뿐 아니라 한·중·일(CJK) 문자도 대상이다. 간판, 제품 라벨, UI 목업, 손글씨까지 “글자다운 글자”가 나온다는 설명이다. 이 주장은 아직 외부 독립 벤치마크로 검증되지는 않았다.

속도와 규모도 올라갔다. 한 번에 최대 8장까지 생성 가능하고, 기본 출력이 4096×4096으로 커졌다. OpenAI는 이전 세대 대비 생성 속도가 약 2배 빨라졌다고 밝혔다.

항목이전(ChatGPT Images 1)ChatGPT Images 2.0
최대 해상도1024×1024 중심최대 4096×4096 (2K)
동시 생성최대 4장최대 8장
텍스트 정확도일부 오탈자 빈발표준 벤치마크 99% 주장
생성 속도기준약 2배
모드단일Instant + Thinking

자료: Axios, Interesting Engineering, Startup Fortune (2026-04-21). 속도·정확도는 OpenAI 자체 수치.

‘Thinking’ 모드는 왜 추가됐나

Instant는 이름 그대로 빠른 생성에 초점을 맞춘 기본 모드고, Thinking 모드는 렌더링 전에 모델이 구도·타이포·색상 조합을 더 오래 고민하도록 설계됐다. 텍스트 LLM에서 성공한 추론 예산{{thinking-budget}} 개념이 이미지 생성으로 확장된 형태로 볼 수 있다. 디자인 목업처럼 “첫 시도에서 정확히 나와야 하는” 작업이 주요 타깃이다.

라이브 시연에서는 매거진 스타일의 레이아웃, 정확한 제품 라벨이 들어간 패키지 목업, 다국어 포스터 등이 예시로 등장했다. Axios는 OpenAI가 이번 업데이트를 “이미지 생성이 장난감에서 업무 도구로 옮겨가는 전환점”이라는 프레이밍으로 내세웠다고 전했다.

배포 일정

공개 당일인 4월 21일부터 ChatGPT Plus, Team, Enterprise 가입자 대상으로 단계적 롤아웃이 시작됐다. Free·일반 사용자에 대한 확대 일정은 발표되지 않았다. API 접근은 5월 초 예정이며, 서드파티 인퍼런스 플랫폼 fal은 같은 날 자사 엔터프라이즈 API에서 GPT-Image-2를 지원한다고 별도 보도자료를 냈다. OpenAI 밖에서도 바로 붙여 쓸 수 있는 통로가 열렸다는 뜻이다.

긍정적으로 보는 입장

Interesting Engineering은 이번 업데이트를 “이미지 생성에서 ‘컨텍스트 이해’가 품질 결정 변수로 바뀌는 신호”라고 평했다. 프롬프트를 단순히 렌더링하는 것이 아니라 의미를 파악해 화면을 구성한다는 점에서, 마케팅·디자인·프로토타이핑 현장의 반복 작업 시간이 줄어들 여지가 있다는 해석이다. 텍스트 정확도가 실제로 99%에 근접한다면, 지금까지 Canva·Figma·어도비 파이어플라이로 나눠져 있던 이미지 제작 파이프라인이 ChatGPT 하나로 상당 부분 수렴할 수 있다.

비판적 관점·우려

Gizmodo는 같은 날 공개된 분석 기사에서 “업계가 이미 AI 슬롭{{ai-slop}}(저품질 생성 콘텐츠 범람) 문제를 심각하게 다루고 있는 시점에, 더 빠르고 정교한 이미지 생성기는 잘못된 용도로 쓰일 때 문제를 더 키운다”고 지적했다. 타이포그래피 정확도 99%라는 수치는 가짜 영수증, 위조 간판, 사칭 로고를 만드는 데도 똑같이 유용하기 때문이다.

저작권 쪽도 미해결이다. OpenAI는 이번 공개에서 학습 데이터 구성이나 옵트아웃 정책에 대한 추가 정보를 내놓지 않았다. 아티스트·스톡 이미지 업계는 이미 지난해부터 OpenAI를 상대로 한 소송·분쟁을 이어가고 있고, 2K 해상도와 프로덕션 수준 품질이 현실화되면 이 마찰은 더 강해질 가능성이 있다.

앞으로 지켜볼 지점

  • 텍스트 정확도 99% 수치가 외부 벤치마크(예: GenAI-Bench, ImageNet-Text 류)에서 재현되는지
  • API 5월 초 공개 시 가격 구조 — 해상도·Thinking 모드별 과금이 세분화될지, 경쟁 모델(Google Imagen 5, Midjourney v8)과 가격 경쟁이 어떻게 전개될지
  • 한국어 텍스트 렌더링 품질. OpenAI 발표 예시에는 CJK가 포함됐지만, 실제 한글 레이아웃 정확도는 Nano Banana Pro·Ideogram 3.0 등 기존 강자와 비교 필요
  • 저작권·데이터 거버넌스에 대한 OpenAI의 후속 공식 입장

이번 공개가 의미 있는 건 “이미지 생성이 어떻게 좋아졌는가”가 아니라 “누가 이걸 업무 도구로 쓰게 될 것인가”라는 질문이 구체화됐다는 점이다. Plus·Team·Enterprise 우선 배포라는 순서 자체가 OpenAI가 어떤 시장을 먼저 잡으려 하는지 드러낸다.


출처 및 참고 자료

함께 보면 좋은 글

해시태그
OpenAIGPT-Image-2ChatGPT이미지 생성멀티모달