GPT Image 2 logo
text-to-imagetext + image -> image

GPT Image 2

OpenAI의 최첨단 이미지 생성 및 편집 모델로, 사실적인 출력물을 제공하며 거의 완벽한 텍스트 렌더링, 다국어 지원, 정확한 지시사항 준수, 최대 2K 네이티브(최대 4K까지 확장 가능)의 유연한 고해상도 기능을 갖추고 있습니다.

提供方
OpenAI
输入
text + image
输出
image

GPT Image 2

개요

GPT Image 2 (API 모델명: gpt-image-2)는 OpenAI의 대표 이미지 생성 및 편집 모델로, 2026년 4월에 GPT Image 1.5의 후속 모델로 출시되었습니다. ChatGPT에서 직접 이미지 생성을 지원하며(ChatGPT Images 2.0), 개발자는 OpenAI API를 통해 사용할 수 있습니다. 이 모델은 자연어 명령을 사용하여 정밀한 수정이 가능한 텍스트-이미지 생성과 이미지-이미지 편집 모두에서 뛰어난 성능을 발휘합니다.

주요 기능

  • 텍스트-이미지 생성: 상세한 텍스트 프롬프트로 고품질 이미지를 생성합니다.
  • 이미지 편집: 기존 이미지를 입력으로 받아 텍스트 명령으로 대상 편집을 적용합니다.
  • 텍스트 렌더링: 조밀한 레이아웃, 작은 글꼴, 다국어 스크립트, 로고, 타이포그래피 등 포함 텍스트에 대해 거의 완벽한 정확도를 제공합니다.
  • 포토리얼리즘 및 스타일 제어: 이전 모델의 일반적인 'AI 느낌' 없이 사실적이고 상업적 수준의 이미지를 생성합니다.
  • 해상도 및 유연성: 최대 2K(2048px) 해상도를 기본 지원하며, 특정 구성에서 API로 4K까지 확장 가능합니다. 유연한 종횡비와 크기(16px 배수, 종횡비 ≤ 3:1, 최대 약 830만 픽셀).
  • 성능: 중간 생성 속도의 최고 품질 계층; 재현 가능한 결과를 위한 일관된 스냅샷 지원.

장점

  • 탁월한 프롬프트 준수 및 복잡한 장면 구성.
  • 텍스트가 많은 비주얼(포스터, 패키징, 인포그래픽, 제품 라벨, 광고)을 탁월하게 처리.
  • 제품 사진, 라이프스타일 샷, 마케팅 자산에 강한 포토리얼리즘.
  • 원본 이미지 충실도를 유지하면서 정밀한 편집 제어.
  • 다국어 텍스트 지원 및 정확한 타이포그래피/레이아웃 렌더링.
  • 품질 우선 아키텍처로 이전 모델보다 빠른 생성.

한계

  • 매우 복잡한 자연 환경(예: 빽빽한 잎사귀나 유기적 질감)에서 가끔 일관성 부족.
  • OpenAI의 콘텐츠 안전 필터의 적용을 받으며, 제한된 주제와 관련된 프롬프트를 차단하거나 수정할 수 있음.
  • 네거티브 프롬프트, 비디오, 오디오, 스트리밍 출력을 기본 지원하지 않음.
  • 편집 결과는 입력 이미지 품질과 프롬프트 구체성에 따라 달라질 수 있음.
  • 더 높은 해상도 출력(2K 초과)은 토큰/비용 사용을 증가시키며 명시적인 API 크기 조정이 필요할 수 있음.

효과적인 프롬프트 작성 방법

GPT Image 2는 자연어 프롬프트를 매우 잘 따르지만, 명확성과 구조화가 결과를 최대화합니다:

  1. 구체적이고 구조화하기: 주제, 스타일, 조명, 구성, 분위기, 카메라 세부 정보를 설명하세요. 예시: "미니멀한 흰색 대리석 표면 위에 놓인 세련된 블랙 무선 이어버드 케이스의 포토리얼리스틱 제품 샷, 부드러운 스튜디오 조명과 은은한 반사, 깔끔한 제품 사진 스타일, 높은 디테일, 2K 해상도."

  2. 텍스트 정확하게 처리하기: 정확한 텍스트, 글꼴, 크기, 배치를 명시적으로 인용하세요. 예시: "상단 중앙에 현대적인 산세리프 글꼴로 굵은 흰색 텍스트 'SUMMER SALE 50% OFF' 포함."

  3. 편집 시: 입력 이미지를 명확히 참조하고 변경 사항을 설명하세요. 이미지 포함 예시 프롬프트: "배경을 야간의 미래형 사이버펑크 도시로 변경, 전경 제품은 그대로 유지, 표면에 네온 반사 추가."

  4. 종횡비 및 해상도: 프롬프트에 포함하거나 API 매개변수 사용 (예: "와이드 가로 종횡비, 2048x1152 해상도" 또는 API size 매개변수 "2048x2048").

  5. 스타일 참조: 아티스트, 매체 또는 미적 스타일 사용: "[브랜드]의 전문 제품 사진 스타일, 영화 같은 조명."

  6. 반복 작업: 후속 편집에서 개선을 위해 모델의 강력한 지시 따르기 능력 활용.

API 사용 참고 사항

  • 엔드포인트: v1/images/generations (텍스트-이미지) 및 v1/images/edits (이미지 편집).
  • 편집용 입력 이미지는 크기/해상도 지침을 충족해야 합니다.
  • 비용은 해상도와 복잡성에 따라 달라집니다 (OpenAI 가격 계산기 참조).
  • gpt-image-2-2026-04-21과 같은 스냅샷은 버전 일관성을 보장합니다.

GPT Image 2 提示词

0 个示例

继续探索

暂无提示词

该模型的示例会显示在这里。

浏览提示词