Nano Banana es el nombre clave para la más reciente versión del modelo de IA de Google para la edición y generación de imágenes. Su nombre oficial es Gemini 2.5 Flash Image y está desarrollado por Google DeepMind.
La función principal de Nano Banana es permitir a los usuarios editar y generar imágenes de forma intuitiva, simplemente usando lenguaje natural. En lugar de requerir conocimientos avanzados de software como Photoshop, la herramienta permite a cualquiera realizar ediciones complejas con instrucciones de texto sencillas.
Está integrado en la aplicación de Gemini y también está disponible para desarrolladores a través de la API de Gemini y Google AI Studio.
Sus capacidades incluyen:
- Edición y transformación de imágenes: Puedes cambiar fondos, modificar la iluminación, y alterar elementos específicos de una foto (como la ropa o el peinado) sin afectar el resto de la imagen.
- Generación de imágenes: A partir de una descripción de texto, Nano Banana puede crear imágenes originales.
- Mantenimiento de coherencia: Una de las características más destacadas de este modelo es su capacidad para mantener la identidad visual de personas o mascotas a lo largo de múltiples ediciones, lo que evita que los rasgos cambien con cada modificación.
- Fusión de imágenes: Permite combinar varias fotos para crear una nueva composición, por ejemplo, fusionar a varias personas en una misma escena.
- Creación de contenido creativo: Ha ganado popularidad por tendencias virales como la conversión de fotos de personas en figuras de acción o avatares.