
Guía de Nano Banana: cómo usar el editor de imágenes con IA de Google para editar con referencias
Guía práctica de Nano Banana en 2026: modelos actuales, flujos con varias imágenes, fórmulas de prompt, ajustes, precios y errores comunes al editar imágenes.
Nano Banana ya no es solo un apodo llamativo que la gente usa en redes sociales. A fecha de 23 de marzo de 2026, se ha convertido en el nombre paraguas que Google utiliza para una familia real de modelos nativos de generación y edición de imágenes dentro del ecosistema Gemini. Y eso importa, porque la mayoría de las personas que buscan Nano Banana no solo quieren saber “qué es”. En realidad están intentando resolver una pregunta mucho más práctica: cómo usarlo bien para conseguir una edición limpia, mantener estable la identidad del sujeto y reducir las generaciones fallidas.
Ese es exactamente el hueco que intenta cubrir esta guía.
En lugar de repetir consejos vagos de “prompt engineering”, este artículo se centra en el flujo que más importa en Nano Banana: la edición basada en referencias. Es decir, mantener una cara, un producto, una composición o una identidad visual mientras cambias partes concretas de la imagen. Si quieres un flujo directo en navegador para ese tipo de trabajo, puedes empezar con Nano Banana en Grok Video Generator y entrar directamente en una experiencia de imagen a imagen con el modelo ya seleccionado.

Qué significa realmente Nano Banana en 2026
En la documentación actual de Gemini API, Nano Banana hace referencia a tres modelos de imagen:
- Nano Banana
gemini-2.5-flash-image, el modelo estable optimizado para generación rápida de imágenes, edición conversacional y alto volumen. - Nano Banana 2
gemini-3.1-flash-image-preview, el modelo rápido más nuevo, con más opciones de tamaño de salida, mejor consistencia y contexto de búsqueda. - Nano Banana Pro
gemini-3-pro-image-preview, la opción premium pensada para mejor renderizado de texto, instrucciones más complejas y activos visuales de nivel estudio.
El nombre puede resultar confuso porque “Nano Banana” empezó como una forma informal de referirse a Gemini 2.5 Flash Image, pero hoy las páginas y los materiales oficiales de Google lo tratan como una familia completa de modelos, no como una única versión.
Ese cambio, en realidad, ayuda. Refleja mejor la decisión real que tiene que tomar el usuario:
- ¿Quieres el bucle de edición más rápido?
- ¿Quieres el mejor equilibrio entre velocidad y control?
- ¿Quieres la salida más sólida para composición compleja y texto dentro de la imagen?
Si tu caso de uso es la edición basada en referencias, esa elección afecta a la calidad final más de lo que parece.
En qué destaca Nano Banana
Nano Banana rinde mejor cuando la tarea no es “crear una imagen aleatoria desde cero”, sino “modificar esta imagen conservando estables las partes importantes”. Los propios materiales oficiales de Google lo posicionan de forma consistente alrededor de edición conversacional, mezcla de varias imágenes, consistencia del sujeto e iteración visual en varios turnos.
Estos son los casos en los que normalmente funciona mejor:
| Tarea | Por qué Nano Banana funciona bien | Qué suele fallar |
|---|---|---|
| Edición de retratos manteniendo identidad | Suele conservar mejor cara, línea del cabello y parecido general que muchos flujos antiguos de texto + imagen | Si el prompt pide demasiados cambios a la vez, puede deformar rasgos faciales |
| Mockups de producto y variaciones publicitarias | Funciona bien cuando necesitas “mantener el producto y cambiar el contexto” | Reflejos, logos y texto pequeño del envase pueden desviarse |
| Composición de varias referencias | Puede fusionar varias referencias en una sola composición nueva, no solo repintar una imagen | Demasiadas referencias con el mismo peso generan prioridades borrosas |
| Transferencia de estilo conservando estructura | Cambia textura, paleta, ambiente o materiales sin rehacer por completo la composición | Un estilo demasiado agresivo puede imponerse sobre identidad o perspectiva |
| Edición iterativa | Google recomienda explícitamente conversaciones o flujos multi-turno para iterar imágenes | Mucha gente intenta arreglar todo en un único prompt en vez de refinar por ejes |
Hay dos hechos actuales que merece la pena recordar:
- La guía de Gemini App destaca la mezcla de hasta tres imágenes en el flujo de consumo.
- La guía más reciente de Pro indica que determinadas superficies soportan de 6 a 14 entradas, según el modelo y el contexto del producto.
Esa es una de las razones por las que Nano Banana se siente distinto a editores de imagen anteriores. Está pensado para orquestar referencias, no solo para generar desde un prompt.
Una forma mejor de ejecutar una edición con Nano Banana
La mayoría de las malas ediciones en Nano Banana no ocurren porque el modelo sea flojo. Ocurren porque el usuario nunca le explica con claridad qué es sagrado y qué es negociable.
El flujo más limpio es este:
- Elegir una referencia principal.
- Indicar qué debe permanecer sin cambios.
- Indicar qué debe cambiar.
- Indicar qué se debe añadir.
- Definir el estándar visual final.
- Refinar un problema cada vez.

Paso 1: elige una referencia ancla
La referencia ancla es la imagen que contiene la información más importante y no negociable.
Puede ser:
- la cara que necesitas conservar
- la forma del producto y su branding
- la distribución de una habitación y el ángulo de cámara
- la silueta de una prenda
Si subes tres referencias con la misma importancia, Nano Banana tiene que adivinar cuál manda. Ahí es donde empieza la deriva de identidad.
El patrón más fiable es:
Imagen ancla: contiene identidad o composiciónReferencia de apoyo 1: aporta estilo o materialReferencia de apoyo 2: aporta objeto, atrezzo o contexto
Paso 2: escribe primero las reglas de preservación
No empieces con frases como “hazlo más cinematográfico” o “convierte esto en una campaña de lujo”. Empieza por lo que no se puede mover.
Un buen lenguaje de preservación suele sonar así:
- Mantén la forma de la cara, la línea del cabello y el ángulo de cámara.
- Conserva la silueta del producto, la posición de la etiqueta y la forma del tapón.
- Mantén la distribución de la estancia y la perspectiva original.
- Conserva la misma identidad del personaje y la estructura de la ropa.
Es un lenguaje menos vistoso, pero es el que realmente hace el trabajo.
Paso 3: cambia solo las variables necesarias
Después de fijar lo que debe conservarse, define el cambio exacto:
- sustituir la chaqueta
- eliminar el desorden del fondo
- añadir el producto en la mano
- transformar una habitación moderna en una suite tipo boutique hotel
Cuanto más preciso seas, menos probable será que el modelo reescriba toda la imagen.
Paso 4: añade el estándar visual final
Aquí es donde muchos usuarios se quedan cortos.
Nano Banana responde mejor cuando el acabado está bien definido:
- imagen publicitaria premium
- foto limpia tipo catálogo de comercio electrónico
- retrato editorial
- fotograma de póster cinematográfico
- luz natural suave
- iluminación de estudio de alta gama
Sin esa capa final, la edición puede ser correcta a nivel lógico, pero no convincente a nivel visual.
La estructura de prompt que reduce la deriva
El prompt más fiable en Nano Banana no es necesariamente largo. Es estructurado.
Usa esta fórmula:
Keep + Change + Add + Render

La plantilla general es esta:
Keep [identity / object / pose / layout / perspective] unchanged.
Change [the specific thing that should be replaced or restyled].
Add [new prop / environment / lighting / composition cue].
Render as [quality target, style target, or publishing format].Ejemplo 1: restyling de retrato
Keep the subject's face shape, hairline, expression, and camera angle unchanged.
Change the outfit to a clean monochrome streetwear look.
Add soft studio rim light and a neutral textured backdrop.
Render as a premium editorial portrait with natural skin texture.Ejemplo 2: composición de producto
Keep the uploaded product shape, branding, and cap details unchanged.
Change the plain tabletop scene into a premium launch visual.
Add a realistic hand holding the product, soft reflections, and controlled studio shadows.
Render as a polished commercial ad image.Ejemplo 3: transformación de interiores
Keep the room layout, wall positions, and camera perspective unchanged.
Change the furniture styling into a refined boutique hotel interior.
Add warm practical lighting, richer textiles, and elegant decor accents.
Render as a photorealistic interior design photo with balanced contrast.Esta fórmula funciona porque replica el verdadero flujo de decisión del modelo:
- qué conservar
- qué modificar
- qué información nueva introducir
- qué estándar visual alcanzar
Autor

Categorías
Más Publicaciones
Boletín de Grok Video
Únete a la comunidad de Grok Video
Suscríbete para las últimas noticias y actualizaciones de Grok Video Generator




