Crear imágenes con IA: guía básica

La mayoría de las «guías para principiantes» sobre generación de imágenes con IA parecen un glosario. Esta asume que no te importa la tecnología: solo quieres un póster para la boda de tu primo, un banner para tu tienda Shopify o una ilustración para tu blog, y has oído que la IA ya puede hacerlo.

Este es el camino más corto entre «nunca lo he probado» y «tengo una imagen usable en mi carpeta de descargas».

Qué es realmente la generación de imágenes con IA (en 30 segundos)

Escribes una descripción («interior acogedor de cafetería, luz cálida de tarde, plantas en el alféizar») y un modelo entrenado genera una imagen que encaja. No hay plantillas ni búsqueda en bancos de imágenes. La imagen no existía antes de tu prompt.

El nombre técnico es difusión (ruido aleatorio que se refina paso a paso), pero no hace falta saberlo para obtener buenos resultados.

Tu primer prompt, en tres partes

Casi todo prompt que funciona para principiantes sigue esta forma:

[Sujeto] · [Estilo o medio] · [Ambiente, luz o detalle]

Ejemplos:

Cachorro golden retriever · ilustración pastel suave · luz de mañana clara, ambiente esperanzador
Matcha latte sobre mesa de piedra · fotografía de producto · poca profundidad de campo, fondo neutro
Horizonte futurista al atardecer · estilo anime · lluvia en la calle, reflejos de neón

Una sola frase — sujeto, estilo, ambiente — te lleva al 80 % de una imagen usable. Luego puedes añadir más (encuadre, paleta…), pero no empieces por ahí.

Los tres errores del primer día

1. Describirlo todo en un solo prompt. Prompts de 80 palabras no hacen al modelo más preciso: al revés. Empieza con una frase. Genera. Luego edita (señala la zona y di qué cambiar) en lugar de reescribir todo.

2. Pedir algo vago y esperar magia. «Un perro» da un perro genérico. «Un mestizo negro saltando por una pelota de tenis amarilla en un césped soleado» da lo que imaginas. La especificidad lo es todo.

3. Generar una vez y rendirse. Es no determinista: mismo prompt, imagen distinta. Regenera; a veces la segunda o tercera acera. O refina: conserva lo que te gusta, edita el resto.

Texto dentro de la imagen (antes difícil, ahora menos)

Si quieres palabras dentro de la imagen — titular, cartel, logo — pon el texto exacto entre comillas:

Cartel de madera sobre un café, "Open from 7 AM" en rotulación vintage pintada a mano, luz suave de mañana

Dos reglas:

Pocas palabras. 4–12 es el punto dulce. Los párrafos largos aún confunden a los modelos.
Indica la posición. «arriba», «centrado», «abajo a la derecha».

GPT Image 2 (el motor detrás de imagesv2) maneja bien texto multilingüe: chino, japonés, coreano, árabe, alemán, francés. Puedes poner 新年快乐 o 春の桜 y suele salir bien.

Tamaño del lienzo

Tres formatos cubren casi todo:

Cuadrado (1024×1024) — Instagram, avatares, miniaturas de podcast.
Vertical (1024×1536) — Pinterest, fondos de móvil, stories, pósteres verticales.
Horizontal (1536×1024) — cabeceras de blog, miniaturas de YouTube, diapositivas, banners.

Elige según dónde vivirá la imagen. No generes cuadrado y recortes después: pierdes lo que querías.

Estándar vs alta calidad

Empieza con Estándar: rápido y más barato, suficiente para ver si el prompt va bien. Cuando te encante un resultado, regenera en alta calidad para el archivo final. No gastes créditos HQ explorando.

Primera sesión de 5 minutos

Abre el playground de imagesv2.
Escribe un prompt para algo que de verdad necesites.
Usa la fórmula sujeto · estilo · ambiente. Una frase.
Genera en Estándar, 1024×1024 (o la relación que toque).
Si falla algo, edita zonas, no todo el prompt.
Cuando te guste el boceto, regenera en HQ y descarga.

Si completas ese ciclo, ya lo has hecho. Lo demás es gusto y práctica.

Para seguir

Si miras el precio: paquete único 14,90 $ — 1.000 créditos, sin suscripción, créditos que no caducan. Suficiente para cientos de borradores y varias decenas de finales HQ.

Generación de imágenes con IA para quien nunca lo ha probado

Índice