
GPT Image 2
OpenAIの最先端画像生成・編集モデル。フォトリアリスティックな出力、ほぼ完璧なテキストレンダリング、多言語対応、正確な指示追従、最大2Kネイティブ(4Kまで拡張可能)の柔軟な高解像度機能を提供します。

概要
GPT Image 2(APIモデル名: gpt-image-2)は、GPT Image 1.5の後継として2026年4月にリリースされた、OpenAIの主力画像生成・編集モデルです。ChatGPT内で直接画像を作成し(ChatGPT Images 2.0として)、開発者向けにOpenAI APIでも利用可能です。テキストから画像を生成する機能と、画像から画像への編集機能の両方に優れ、自然言語の指示で精密な変更が可能です。
主な機能
- テキスト→画像生成: 詳細なテキストプロンプトから高忠実度の画像を生成します。
- 画像編集: 既存の画像を入力として受け取り、テキスト指示による対象を絞った編集を適用します。
- テキストレンダリング: 埋め込みテキストの精度はほぼ完璧で、密なレイアウト、小さなフォント、多言語スクリプト、ロゴ、タイポグラフィにも対応します。
- フォトリアリズムとスタイル制御: 従来モデルのような「AIらしさ」のない、リアルで商用レベルの画像を生成します。
- 解像度と柔軟性: 最大2K(2048px)の解像度をネイティブサポートし、APIでは特定の構成で4Kまで対応可能。アスペクト比やサイズも柔軟に指定できます(16pxの倍数、アスペクト比3:1以下、最大約830万ピクセル)。
- パフォーマンス: 最高品質のティアで中程度の生成速度を実現。一貫性のあるスナップショットに対応し、再現可能な結果を得られます。
強み
- プロンプトへの高い追従性と複雑なシーンの構成力。
- テキストが多いビジュアル(ポスター、パッケージ、インフォグラフィック、製品ラベル、広告)を優れた品質で処理。
- 製品写真、ライフスタイルショット、マーケティング素材における強いフォトリアリズム。
- 元の画像の忠実度を保ちつつ、精密な編集制御が可能。
- 多言語テキスト対応と正確なタイポグラフィ・レイアウトレンダリング。
- 品質優先のアーキテクチャにより、従来モデルよりも高速な生成。
制限事項
- 非常に複雑な自然環境(密な葉や有機的なテクスチャなど)で、まれに不整合が生じる。
- OpenAIのコンテンツ安全フィルターの対象であり、制限されたテーマを含むプロンプトはブロックまたは変更される場合がある。
- ネガティブプロンプト、動画、音声、ストリーミング出力にはネイティブ対応していない。
- 編集結果は、入力画像の品質とプロンプトの具体性によって変動する。
- 高解像度出力(2K超)はトークン/コストの消費が増加し、APIで明示的なサイズ指定が必要になる場合がある。
効果的なプロンプトの書き方
GPT Image 2は自然言語のプロンプトに非常に忠実に従いますが、明確さと構造化が結果を最大化します。
-
具体的かつ構造化する:被写体、スタイル、照明、構図、雰囲気、カメラの詳細を記述します。例:「ミニマルな白い大理石の表面に置かれた、スタイリッシュな黒いワイヤレスイヤホンケースのフォトリアリスティックな商品写真、柔らかなスタジオ照明と微妙な反射、クリーンな商品撮影スタイル、高精細、2K解像度。」
-
テキストを正確に扱う:正確なテキスト、フォント、サイズ、配置を明示的に引用します。例:「上部中央にモダンなサンセリフフォントで太字の白いテキスト 'SUMMER SALE 50% OFF' を含めてください。」
-
編集の場合:入力画像を明確に参照し、変更を記述します。画像付きのプロンプト例:「背景を未来的なサイバーパンクの夜の街並みに変更し、手前の商品はそのままに、表面にネオン反射を追加してください。」
-
アスペクト比と解像度:プロンプトに含めるか、APIパラメータを使用します(例:「ワイドなランドスケープアスペクト比、2048x1152解像度」、またはAPIの
sizeとして「2048x2048」)。 -
スタイルの参照:アーティスト、メディア、美意識を使用します:「[ブランド]によるプロフェッショナルな商品写真のスタイルで、シネマティックな照明。」
-
反復:モデルの優れた指示追従性を活かし、後続の編集で改良を加えます。
API使用上の注意
- エンドポイント:
v1/images/generations(テキストから画像へ)およびv1/images/edits(画像編集)。 - 編集用の入力画像はサイズと解像度のガイドラインを満たす必要があります。
- コストは解像度と複雑さに応じて変動します(OpenAIの料金計算ツールを参照)。
gpt-image-2-2026-04-21のようなスナップショットはバージョンの一貫性を保証します。
GPT Image 2 提示词
0 个示例