
Grok Video Generator
Cargando...

Guía práctica de Nano Banana en 2026: modelos actuales, flujos con varias imágenes, fórmulas de prompt, ajustes, precios y errores comunes al editar imágenes.
Nano Banana ya no es solo un apodo llamativo que la gente usa en redes sociales. A fecha de 23 de marzo de 2026, se ha convertido en el nombre paraguas que Google utiliza para una familia real de modelos nativos de generación y edición de imágenes dentro del ecosistema Gemini. Y eso importa, porque la mayoría de las personas que buscan Nano Banana no solo quieren saber “qué es”. En realidad están intentando resolver una pregunta mucho más práctica: cómo usarlo bien para conseguir una edición limpia, mantener estable la identidad del sujeto y reducir las generaciones fallidas.
Ese es exactamente el hueco que intenta cubrir esta guía.
En lugar de repetir consejos vagos de “prompt engineering”, este artículo se centra en el flujo que más importa en Nano Banana: la edición basada en referencias. Es decir, mantener una cara, un producto, una composición o una identidad visual mientras cambias partes concretas de la imagen. Si quieres un flujo directo en navegador para ese tipo de trabajo, puedes empezar con Nano Banana en Grok Video Generator y entrar directamente en una experiencia de imagen a imagen con el modelo ya seleccionado.

En la documentación actual de Gemini API, Nano Banana hace referencia a tres modelos de imagen:
gemini-2.5-flash-image, el modelo estable optimizado para generación rápida de imágenes, edición conversacional y alto volumen.gemini-3.1-flash-image-preview, el modelo rápido más nuevo, con más opciones de tamaño de salida, mejor consistencia y contexto de búsqueda.gemini-3-pro-image-preview, la opción premium pensada para mejor renderizado de texto, instrucciones más complejas y activos visuales de nivel estudio.El nombre puede resultar confuso porque “Nano Banana” empezó como una forma informal de referirse a Gemini 2.5 Flash Image, pero hoy las páginas y los materiales oficiales de Google lo tratan como una familia completa de modelos, no como una única versión.
Ese cambio, en realidad, ayuda. Refleja mejor la decisión real que tiene que tomar el usuario:
Si tu caso de uso es la edición basada en referencias, esa elección afecta a la calidad final más de lo que parece.
Nano Banana rinde mejor cuando la tarea no es “crear una imagen aleatoria desde cero”, sino “modificar esta imagen conservando estables las partes importantes”. Los propios materiales oficiales de Google lo posicionan de forma consistente alrededor de edición conversacional, mezcla de varias imágenes, consistencia del sujeto e iteración visual en varios turnos.
Estos son los casos en los que normalmente funciona mejor:
| Tarea | Por qué Nano Banana funciona bien | Qué suele fallar |
|---|---|---|
| Edición de retratos manteniendo identidad | Suele conservar mejor cara, línea del cabello y parecido general que muchos flujos antiguos de texto + imagen | Si el prompt pide demasiados cambios a la vez, puede deformar rasgos faciales |
| Mockups de producto y variaciones publicitarias | Funciona bien cuando necesitas “mantener el producto y cambiar el contexto” | Reflejos, logos y texto pequeño del envase pueden desviarse |
| Composición de varias referencias | Puede fusionar varias referencias en una sola composición nueva, no solo repintar una imagen | Demasiadas referencias con el mismo peso generan prioridades borrosas |
| Transferencia de estilo conservando estructura | Cambia textura, paleta, ambiente o materiales sin rehacer por completo la composición | Un estilo demasiado agresivo puede imponerse sobre identidad o perspectiva |
| Edición iterativa | Google recomienda explícitamente conversaciones o flujos multi-turno para iterar imágenes | Mucha gente intenta arreglar todo en un único prompt en vez de refinar por ejes |
Hay dos hechos actuales que merece la pena recordar:
Esa es una de las razones por las que Nano Banana se siente distinto a editores de imagen anteriores. Está pensado para orquestar referencias, no solo para generar desde un prompt.
La mayoría de las malas ediciones en Nano Banana no ocurren porque el modelo sea flojo. Ocurren porque el usuario nunca le explica con claridad qué es sagrado y qué es negociable.
El flujo más limpio es este:

La referencia ancla es la imagen que contiene la información más importante y no negociable.
Puede ser:
Si subes tres referencias con la misma importancia, Nano Banana tiene que adivinar cuál manda. Ahí es donde empieza la deriva de identidad.
El patrón más fiable es:
Imagen ancla: contiene identidad o composiciónReferencia de apoyo 1: aporta estilo o materialReferencia de apoyo 2: aporta objeto, atrezzo o contextoNo empieces con frases como “hazlo más cinematográfico” o “convierte esto en una campaña de lujo”. Empieza por lo que no se puede mover.
Un buen lenguaje de preservación suele sonar así:
Es un lenguaje menos vistoso, pero es el que realmente hace el trabajo.
Después de fijar lo que debe conservarse, define el cambio exacto:
Cuanto más preciso seas, menos probable será que el modelo reescriba toda la imagen.
Aquí es donde muchos usuarios se quedan cortos.
Nano Banana responde mejor cuando el acabado está bien definido:
Sin esa capa final, la edición puede ser correcta a nivel lógico, pero no convincente a nivel visual.
El prompt más fiable en Nano Banana no es necesariamente largo. Es estructurado.
Usa esta fórmula:
Keep + Change + Add + Render

La plantilla general es esta:
Keep [identity / object / pose / layout / perspective] unchanged.
Change [the specific thing that should be replaced or restyled].
Add [new prop / environment / lighting / composition cue].
Render as [quality target, style target, or publishing format].Keep the subject's face shape, hairline, expression, and camera angle unchanged.
Change the outfit to a clean monochrome streetwear look.
Add soft studio rim light and a neutral textured backdrop.
Render as a premium editorial portrait with natural skin texture.Keep the uploaded product shape, branding, and cap details unchanged.
Change the plain tabletop scene into a premium launch visual.
Add a realistic hand holding the product, soft reflections, and controlled studio shadows.
Render as a polished commercial ad image.Keep the room layout, wall positions, and camera perspective unchanged.
Change the furniture styling into a refined boutique hotel interior.
Add warm practical lighting, richer textiles, and elegant decor accents.
Render as a photorealistic interior design photo with balanced contrast.Esta fórmula funciona porque replica el verdadero flujo de decisión del modelo:
La documentación actual de Google deja bastante clara la posición de cada modelo:

| Modelo | Caso de uso ideal | Resolución y controles | Búsqueda / Thinking | Precio API por salida de imagen |
|---|---|---|---|---|
Nano Banana (gemini-2.5-flash-image) | Ediciones rápidas, muchas variaciones, mockups exprés | Salidas de clase 1024px y relaciones habituales hasta 21:9 | Sin contexto de búsqueda ni thinking | $0.039 por imagen |
Nano Banana 2 (gemini-3.1-flash-image-preview) | La mejor opción general para edición con referencias | 0.5K, 1K, 2K, 4K; añade ratios extremos como 1:4 y 8:1 | Con contexto de búsqueda y thinking | $0.045 por 0.5K, $0.067 por 1K, $0.101 por 2K, $0.151 por 4K |
Nano Banana Pro (gemini-3-pro-image-preview) | Mockups premium, infografías, piezas con texto y prompts complejos | 1K, 2K, 4K con seguimiento de instrucciones más sólido | Con contexto de búsqueda y thinking | $0.134 por 1K o 2K, $0.24 por 4K |
Elige Nano Banana cuando:
Elige Nano Banana 2 cuando:
Elige Nano Banana Pro cuando:
Muchas guías tratan los ajustes como si fueran una simple checklist. Ese enfoque se queda corto. Los ajustes solo sirven si ayudan al tipo de edición que estás intentando hacer.
La lectura práctica es esta:
| Necesidad | Mejor elección de ajuste | Por qué |
|---|---|---|
| Post social, portada de reel, thumbnail | 9:16 o 16:9 | Mejor encaje para piezas pensadas para distribución |
| Hero de producto, portada de blog | 16:9 o 4:5 | Facilita recortes para desktop y móvil |
| Comparativas visuales o diagramas | 1:1 o 4:3 | Mejor control sobre densidad y composición |
| Banners o panorámicas | 21:9 en 2.5, o ratios muy anchos como 4:1 en 3.1 | Útil para headers, heros web y escenas ultraanchas |
| Revisión visual detallada | 2K o 4K en 3.1 / Pro | Más espacio para texto, bordes, packaging o infografías |
Hay dos reglas que ayudan más que cualquier lista larga de settings:
La propia guía oficial de Pro sigue señalando límites actuales en texto pequeño, exactitud factual en gráficos, mezclas complejas y consistencia de personajes. Esas limitaciones son reales, pero la mayoría de usuarios las agravan con un flujo mal planteado.
Patrón malo:
Cómo arreglarlo:
Si todas compiten, el modelo no sabe qué debe preservar.
Cómo arreglarlo:
“Hazlo mejor” o “hazlo más cinematográfico” no basta.
Cómo arreglarlo:
Sigue siendo un punto débil conocido, especialmente en pósters densos, etiquetas pequeñas o visuales con datos.
Cómo arreglarlo:
Google advierte explícitamente de que la exactitud factual en diagramas e infografías todavía necesita comprobación humana.
Cómo arreglarlo:
Los prompts de estilo agresivo pueden hacer que el modelo rehaga al sujeto en lugar de editarlo.
Cómo arreglarlo:
Si usas Nano Banana para trabajo real y no solo para experimentar, el flujo de producción debería ser corto y repetible:
Keep + Change + Add + Render.Esta también es la razón más clara para usar una superficie centrada en edición en vez de ir saltando entre interfaces más generales de Gemini. Si lo que necesitas es edición imagen a imagen, un flujo más enfocado reduce fricción y acelera la iteración.
Nano Banana se entiende mejor como una familia de herramientas de edición con referencias, no como un único modelo milagroso. La versión más rápida funciona muy bien para trabajo de alto volumen. La versión 3.1 es la mejor opción general para la mayoría de usuarios. La versión Pro es la indicada cuando la imagen tiene que comportarse más como un activo final de diseño que como una simple variación creativa.
Pero la verdadera clave no está solo en elegir el modelo correcto. Está en estructurar bien la edición:
Cuando trabajas así, Nano Banana deja de parecer aleatorio y empieza a parecer útil.
Ya no exactamente. Hoy Google usa Nano Banana como etiqueta de familia más amplia. En Gemini API incluye Nano Banana, Nano Banana 2 y Nano Banana Pro.
Ahora mismo, Nano Banana 2 suele ser la mejor opción por defecto para la mayoría de flujos de edición porque equilibra mejor velocidad, consistencia, resolución y coste que el antiguo 2.5.
Sí. Resulta especialmente útil cuando necesitas conservar el producto y cambiar fondo, props, iluminación o dirección creativa. Aun así, conviene revisar a mano texto pequeño, logos y detalles del packaging.
Sí. La composición de múltiples imágenes es una de sus fortalezas principales. La propia guía de Google destaca hasta tres imágenes en flujos de consumo, y las guías de Pro describen soportes con un rango mayor de entradas en superficies compatibles.
Sí. La documentación de generación de imágenes de Google recomienda explícitamente usar chat o conversaciones multi-turno como forma preferente de iterar imágenes.
Intentar resolver identidad, estilo, composición, iluminación y props en una sola generación. Nano Banana suele funcionar mejor cuando bloqueas primero lo que debe mantenerse, acotas el cambio y refinas un problema por turno.

Únete a la comunidad de Grok Video
Suscríbete para las últimas noticias y actualizaciones de Grok Video Generator