食べ物、コーヒー、街角、ペット、デスク — どんなスナップでもアップしてください。
AI が白い細線の輪郭と小さな手書きの一言を物件ごとに添えて、忘れられがちな1枚をあなたの日記カバーに変えます。
新規ユーザーには無料クレジット — 写真をアップしてすぐ試せます
手描き吹き出し(中文「手帐风注解」)は、2025年後半に日本のInstagramから広がったフォトドゥードゥル系の美学です。普段の写真の上に、白い細線の物件アウトラインと日記調の小さなつぶやきを重ねるだけで、ふつうの1枚が「今日の日記カバー」に早変わりします。このページはそのエフェクトを精調プロンプト+5シーンテンプレートに落とし込みました — 写真をアップして生成を押すだけ。
暗い背景には白、明るい背景には濃い色 — モデルが自動でコントラストを判断します。元バズ投稿は夜市シーンでしか機能しなかった弱点を解消しました。
「さっぱり〜」「ふんわり」「今日ちょっと幸せ」 — 物件ラベルではなく、独り言のような一言短文。手帳に向かって囁いているような文体で生成されます。
プロンプトには「8〜12個の異なる物件に注釈」と明記。出力は密度のある手帳ページ感になり、3個だけスカスカという結果になりません。
プロンプトはモデルに「注釈レイヤーのみ追加」と指示します — あなたの顔、料理、構図はそのまま。モデルは上に描き加えるだけです。
このエフェクトは「物件の多いシーン」で真価を発揮します。フレームに写る個別の物件が多いほど、AI が注釈をつけられる対象も増えます。
ブランチ、鍋、タピオカ、カフェスイーツ。どの料理にも食感メモ、どの飲み物にも温度と気分メモ — 「ふんわり」「ちょうど甘い」「さっぱり〜」。
コーヒーカップ、ノートPC、観葉植物、ノート、ヘッドホン。自然な多物件セットアップ。注釈は少し感傷的に — 「コーヒー冷めちゃった」「猫はまだ寝てる」「この本なかなか進まない」。
ネオンの看板、屋台、人混み、メニュー。元バズの舞台 — ネオンの暗い背景に白い細線がコントラスト最大で映えます。
猫、犬、おもちゃ、毛布。ペット注釈はとりわけ可愛く — 「ふわふわ耳」「眠そうな目」「今日はちょっとお利口〜」。
ホテルの部屋、機内食、駅、観光地。旅写真の1ロールが、それぞれの瞬間の気分を捉えた手綴じ日記に。
買い物カゴ、お菓子棚、冷蔵ケース。日常的なシーンほど注釈ポテンシャルが高く — 商品ひとつひとつに名前と一言コメントが付きます。
各カードは典型的な入力写真に対応します。クリックでフルプロンプトを開き、「このシーンを使う」を押すと上の生成器に流し込まれます。あとは自分の写真をアップして生成を押すだけ。
注釈付き写真は天然のコンテンツ素材 — 普段の1枚が、そのまま投稿できる画像+テキストカードに。
縦写真+手書きキャプションは、SNSのカバー形式と相性抜群。注釈にすでに一言が入っているので、追加の文字組みやデザインは不要。
9:16の縦出力はIGストーリーやTikTok縦動画にそのまま流せます。IG純正スタンプより上品で、Canvaテンプレートより手作り感のある仕上がり。
ブログ、Substack、写真投稿に。注釈に感情がすでに乗っているので、本文は一言で十分。
グルメブログ、街歩きエッセイ、ライフスタイル系ニュースレター — ストックフォトでは埋まらない「人の気配のある挿絵」の隙間を埋めます。
GPT Image 2 + 精調プロンプト + 5シーンテンプレート + 透明なクレジット。プロンプトを書く力もデザインスキルも不要で、元バズの感じが再現できます。
画像内テキスト描画でクラス最高。high quality + 大きめサイズなら、英語/日本語/中国語の手書き文字も読みやすく描画 — このスタイルが成立する唯一のモデル。
写真をアップしてすぐ生成、プロンプトを書く必要なし。スタイル/言語/密度を変えたいときは、5つのシーンテンプレートのどれかをコピーして上書きするだけ。
プロンプトはモデルに「顔や主体を変更せず、注釈レイヤーのみ追加」と明示しています。あなたの顔も、料理も、構図もそのまま残ります。
同じ写真+同じプロンプトで4〜8枚回し、最も気の利いた注釈のついた1枚を選べます。モデルは毎回ちがう独り言を書きます。
クレジット消費量は生成ボタンの上に事前表示。新規ユーザーには無料クレジットが付与され、5シーン全部試してから決められます。
このプロンプトとGPT Image 2生成についての質問集。その他のお問い合わせ:support@imagesv2.ai。
いいえ。プロンプトには「顔や主体を変更せず、注釈レイヤーのみ追加」と明記されています。モデルは顔の周りに描き、顔の上には描きません。心配な場合は、顔が小さく写っている写真や顔がフレーム外の写真を選んでください。
3つの特徴:(1) 物件が豊富 — ラベル可能な要素が8個以上(食事、街並み、デスク)。(2) 背景にコントラストがある — 暗いネオンや明るい木目はOK、真っ白な壁はNG。(3) 構図がすでに整理されている。元バズの長沙夜市はこの3つを全部満たしていました。
プロンプト内の【文字ルール】ブロックを書き換えるだけです。英語版なら「English text only, NO Japanese or Chinese characters」、中国語版なら「简体中文 only、汉字工整」に置き換えます。中国語版ページにはコピーですぐ使える中国語シーンプロンプトが用意されています。
GPT Image 2 を medium quality + 1024×1024 で動かすと、まれに「擬似文字」(文字に見えるが文字でない)が出ることがあります。対処:(1) 生成器で quality を high に上げる、(2) 1024×1536 や 1536×1024 を選んで字を大きくする、(3) 2〜3回生成して一番きれいなものを選ぶ。
プロンプト内の「8〜12個の異なる物件に注釈」という数字を変更可能です。密度を上げたいなら「15〜20個」、減らしたいなら「重要な3〜5個に絞る」に。モデルは個数指示によく反応します。
シーン1〜3(グルメ・カフェ・コンビニ)は英語の手書きデモ、シーン4〜5(室内・ペット)は中国語の手書きデモです。レイアウト・密度・装飾パターンはどちらも同じように読み取れます。「このシーンを使う」を押すと、プロンプトはあなたの言語でコピーされます。





品質比較(gpt-image-2)
| 品質 | 速度 | ディテール | クレジット/枚 | 推奨用途 |
|---|---|---|---|---|
| 低 | 最速 (3〜8 秒) | 良好な構図、詳細少なめ | 10 | 高速反復、量産、SNS |
| 中 | 標準 (10〜20 秒) | 豊富なディテール、良好な質感 | 40 | マーケティング画像、プレゼン |
| 高 | 遅め (20〜40 秒) | 最高忠実度、最も繊細 | 110 | 印刷、ポスター、プレミアム素材 |
| 自動 | モデルが判定 | モデルが自動選択 | 40 | 迷ったらこれ |
モデル比較
| モデル | 特徴 | 低/枚 | 高/枚 |
|---|---|---|---|
| gpt-image-2 | 最新・ベスト結果 | 10 | 110 |
コスト節約 Tips
作りたい画像を説明するテキストプロンプトを入力。サイズ(正方形・横・縦)、品質(低/中/高)、出力形式(PNG/JPEG/WebP)、背景(不透明/透過)などのパラメータを調整できます。「生成」をクリックすると、GPT Image 2 が記述から完全に新しい画像を作成します。
GPT Image 2 でより良い結果を出すための Tips
元画像をアップロードし、変更内容を説明するプロンプトを書くと、GPT Image 2 が画像を編集します。マスクなしの場合 GPT Image 2 がどこを変えるかを判断。マスクを使うと、編集領域を精密に制御できます。
GPT Image 2 のマスクなし編集モードを image-to-image として使えます。参考画像をアップロードし、変換内容をプロンプトで記述 — 例: 「この写真を水彩風に変換」「このシーンをサイバーパンクで再構成」。GPT Image 2 が画像を参照しつつ新バージョンを生成します。
GPT Image 2 の image-to-image プロンプト例