GPT Image 2 で画像内テキストを読めるようにする──得意と不得意

2026年4月22日

長年のジョークは「AI は何でも描けるが字だけはダメ」。GPT Image 2 でそのジョークはだいたい終わりかけています――常にではありません。

昔むずかしかった理由

旧モデルは文字を「意味」ではなく「形」として扱いがちでした。GPT Image 2 は字形・綴り・レイアウトの扱いが強く、短く明確な指示なら実在する文字列になります。

安定しやすいもの

短い見出し(4〜12 語)、大見出し+小さいサブコピ、中国語・日本語・韓国語・アラビア語などの多言語併記、ステップ付き図のラベル、ネオンや手描き看板など作法的に指定したタイポ

まだきついもの

画像内の長文(目安 ~40 語超)、極小の文字、ブランドロゴのピクセル一致、大きな表、密度の高い数値チャート――背景だけ生成し、チャートは DTP で足すのが無難です。

プロンプトの型

  1. 本文を引用符で囲む
  2. 配置を書く(上部・中央・右下など)
  3. 言語を明示(非英語特に)
  4. 書体の雰囲気(サンセリフ、ネオン、手描き等)
  5. レイアウトは良いが一語だけ間違い → 編集で直す

プレイグラウンド · 14.90ドル・1000クレジット

imagesv2 チーム

imagesv2 チーム