上传一张随手拍 — 食物、咖啡、街角、宠物、办公桌都行。
AI 会用白色细线和小碎念给画面每个物件加上手写注解,把废片变成你的日记封面。
新用户赠送免费额度 — 上传一张图就能玩
手写风注解(日语「手描き吹き出し」/ 中文「手帐风注解」)是 2025 年下半年从日本 Instagram 蔓延到小红书的一种 photo-doodle 风格 — 在普通生活照上叠一层白色细线手绘 + 日系小碎念,瞬间把「废片」变成「今天的日记封面」。这页面把这套效果拆成了一段精调过的中文 prompt + 5 套即开即用的场景模板,上传任意照片,点生成即可。
深色街景用白色细线 / 浅色室内用深色细线 — 模型会自己判断对比,让注解永远清晰可见。这是原帖只在夜市生效的痛点,我们把它修了。
「清爽~」「松软」「今天有点幸福~」「冰冰的,刚刚好」 — 自动生成的日记体短句,不是干巴巴的物件标签,而是带情绪的内心碎碎念。
Prompt 里写死了「至少标注 8-12 个不同物件」 — 出来的图密度足够,不会只标 3 处显得寡淡。原帖那种「一张图标十几处」的丰盛感,照搬。
Prompt 明确「不要修改人物面部和原图主体,仅在物件旁边添加注解层」 — 你的脸不会被改、食物不会被换、构图不会被动,只是上面多了一层手帐贴纸。
这玩法对「物件丰富的场景」尤其有效 — 桌上有多少东西,AI 就能注解多少。下面是 6 个最适合的方向。
早午餐、火锅、奶茶、饮品 — 食物饮料类是最适合的题材。每道菜每杯饮料都能配「松软」「微甜」「冰冰的~」之类的小碎念。
咖啡杯、笔电、绿植、本子、耳机 — 桌面物件是天然的多元素场景。「今天的咖啡有点苦」「猫在睡觉」「这本书读不下去」一类。
霓虹招牌、小摊、人群、菜单 — 原帖最火的场景就是长沙夜市。霓虹背景特别适合白色细线注解,对比强烈、视觉冲击大。
猫狗的随手拍、玩具、零食、毯子 — 宠物注解格外可爱,「软软的耳朵」「呆呆的眼神」「今天又乖了一点」一类的吐槽。
酒店房间、飞机餐、车站、景点 — 把一次旅行的废片做成手帐日记。每张图标的不是物件,是「在这里的当下心情」。
购物车、零食货架、关东煮、冰柜 — 日杂场景天然多元素。每一样小零食都能起个名字,「这个我每次都买」「冰冰的~」。
每张卡片都对应一个适合的输入场景。点开看完整提示词,再点「做同款」会自动把 prompt 灌到上方的生成器,你只要上传自己的照片就能跑。
手写风注解是天然的「内容素材」 — 一张普通照片瞬间变成可发布的图文卡片。
竖图 + 注解文字本身就是小红书最爱的封面格式。注解里的「今天有点幸福~」一句话就能当图配文,0 二次设计、0 加文案,直接发。
9:16 比例直出,IG Story / TikTok 竖版直接铺满。手写注解感比 IG 自带贴纸更高级,也比 Canva 模板更日系。
九宫格 / 单图发圈都能用。注解里已经有了情绪,配文只要写一句话就够,告别「拍完不知道写啥」。
美食探店、城市漫步、生活方式类公众号最缺的就是「有人味的配图」 — 这套风格刚好填这个缺口。
GPT Image 2 + 调好的 prompt + 5 套场景模板 + 透明积分。不会写 prompt、不会做设计,也能跑出原帖那种感觉。
中文 prompt 直接吃,不用翻译。手写汉字渲染(在 high quality + 大尺寸下)几乎可读 — 是目前最适合做这种「带文字的图」的模型。
上传照片就能立刻生成,不需要写任何提示词。想换风格 / 改语言 / 调密度,照抄 5 套场景模板里的任意一段,覆盖即可。
Prompt 明确「不要修改人物面部和原图主体」 — 模型只在物件外围加注解层。你的脸、食物、构图都在,多出来的只是手帐贴纸。
同一张废片 + 同一段 prompt 跑 4-8 张,挑注解最有趣的那张发。AI 每次的小碎念都不一样,多跑几次能挑到惊喜文案。
点生成前积分消耗就显示在按钮上。新用户赠送免费额度,足够把 5 套场景跑一遍再决定要不要付费。
关于这套提示词和 GPT Image 2 生成的常见问题。其它问题请联系 support@imagesv2.ai。
不会。Prompt 明确写了「不要修改人物面部和原图主体,仅在物件旁边添加注解层」 — 模型会绕开人脸,只在物件、空间和外围加注解。如果你担心,可以选一张人脸不显眼或没有正脸的照片。
三个特征:① 物件丰富(有 8 个以上可标注的元素,比如餐桌、街景、桌面) ② 背景对比明显(深色霓虹 / 浅色木桌都行,纯白墙就不行) ③ 已经构图清晰,不要太杂乱。原帖最火的长沙夜市图就是这三个条件全占。
直接用中文。GPT Image 2 对中文 prompt 的理解深度跟英文持平,特别是「日系小碎念」「手帐感」这种风格关键词,中文表达比英文更精准。5 套场景模板里的中文 prompt 都是直接复制可用。
把 prompt 里「文字规则」那段改一下:英文版改成「English text only, NO Japanese or Chinese characters」,日文版改成「Japanese hiragana / katakana text only」。场景库前三个(美食 / 咖啡桌 / 便利店)用的就是英文版手帐 demo,是英文 prompt 的样板,可以照抄。
GPT Image 2 在 medium quality + 1024×1024 尺寸下渲染复杂汉字时偶尔会出「伪汉字」(看着像但不是字)。解决方法:① 在生成器里把质量调成 high ② 选 1024×1536 或 1536×1024 大尺寸 ③ 多生成几张,挑文字最清晰那张。
Prompt 里的「至少标注 8-12 个不同物件」可以改数字。想更密就改成「至少 15-20 个」,想更稀疏就改成「3-5 个,重点突出」。模型对密度指令的响应还挺准的。





质量档位对比(gpt-image-2)
| 质量 | 生成速度 | 图像效果 | 积分/张 | 适用场景 |
|---|---|---|---|---|
| 低 | 最快 (3-8s) | 构图准确,细节较少 | 10 | 快速验证创意、批量生成、社媒素材 |
| 中 | 中等 (10-20s) | 细节丰富,质感好 | 40 | 正式营销图、展示用途 |
| 高 | 较慢 (20-40s) | 最高画质,细节极致 | 110 | 印刷品、大幅海报、精品素材 |
| 自动 | 由模型决定 | 模型自动选择 | 40 | 不确定时使用 |
模型对比
| 模型 | 特点 | 低质量/张 | 高质量/张 |
|---|---|---|---|
| gpt-image-2 | 最新模型,效果最好 | 10 | 110 |
省钱技巧
输入描述你想要的图像的提示词,调整参数:尺寸(正方形/横版/竖版)、质量(低/中/高)、输出格式(PNG/JPEG/WebP)、背景(不透明或透明)。点击「生成」,GPT Image 2 将根据你的描述创建全新图像。
GPT Image 2 生图技巧
上传源图片,写一段描述你想要修改的提示词,GPT Image 2 会据此修改图像。不使用遮罩时,GPT Image 2 自行决定修改哪些区域;使用遮罩时,你可以精确控制哪些区域被修改。
你可以在编辑模式下不使用遮罩来实现 GPT Image 2 图生图。只需上传参考图,然后在提示词中描述你想要的变换 — 例如「将这张照片转换为水彩画风格」或「用赛博朋克风格重新想象这个场景」。GPT Image 2 会以你的图片为参考生成新版本。
GPT Image 2 图生图提示词示例