GPT Image 2 で画像内テキストを読めるようにする──得意と不得意

2026年4月22日

目次

昔むずかしかった理由安定しやすいものまだきついものプロンプトの型

長年のジョークは「AI は何でも描けるが字だけはダメ」。GPT Image 2 でそのジョークはだいたい終わりかけています――常にではありません。

昔むずかしかった理由

旧モデルは文字を「意味」ではなく「形」として扱いがちでした。GPT Image 2 は字形・綴り・レイアウトの扱いが強く、短く明確な指示なら実在する文字列になります。

安定しやすいもの

短い見出し（4〜12 語）、大見出し＋小さいサブコピ、中国語・日本語・韓国語・アラビア語などの多言語併記、ステップ付き図のラベル、ネオンや手描き看板など作法的に指定したタイポ。

まだきついもの

画像内の長文（目安 ~40 語超）、極小の文字、ブランドロゴのピクセル一致、大きな表、密度の高い数値チャート――背景だけ生成し、チャートは DTP で足すのが無難です。

プロンプトの型

本文を引用符で囲む
配置を書く（上部・中央・右下など）
言語を明示（非英語特に）
書体の雰囲気（サンセリフ、ネオン、手描き等）
レイアウトは良いが一語だけ間違い → 編集で直す

プレイグラウンド · 14.90ドル・1000クレジット

imagesv2 チーム

imagesv2 チーム