Notebookcheck Logo

Google presenta Gemini 2.5 Flash Image "nano-banana" con mayor consistencia de edición

El modelo "nano-banana" de Google DeepMind ofrece ediciones precisas de imágenes (Fuente de la imagen: Gemini)
El modelo "nano-banana" de Google DeepMind ofrece ediciones precisas de imágenes (Fuente de la imagen: Gemini)
El nuevo Gemini 2.5 Flash Image de Google DeepMind, apodado "nano-banana", promete un control más fino sobre la edición de imágenes con IA. Mantiene la coherencia de los caracteres en todas las escenas, permite ediciones de varias vueltas y mezcla imágenes con instrucciones en lenguaje natural, todo ello añadiendo marcas de agua visibles e invisibles para mayor seguridad.

Google DeepMind está lanzando Gemini 2.5 Flash Image, también llamada "nano-banana", para la aplicación Gemini y para desarrolladores a través de la API Gemini, Google AI Studio y Vertex AI. Esta actualización aborda una queja frecuente con las herramientas de imagen de IA: pequeñas ediciones que acaban cambiando toda la imagen. Google describe esta versión como una mejora de la calidad y el control en comparación con versiones anteriores.

La característica principal es la coherencia de los personajes. Puede mantener el mismo aspecto de una persona, una mascota o un producto en distintas escenas, aunque cambie de atuendo, peinado, época o escenario. También puede combinar varias imágenes en una, realizar cambios específicos mediante instrucciones en lenguaje natural y utilizar el conocimiento del mundo de Gemini durante la creación y edición de imágenes.

Puede utilizar esta herramienta para poner al mismo personaje en diferentes escenarios, mostrar un producto desde varios ángulos o mantener la coherencia de las imágenes de marca en todas las campañas. La edición multivuelta le permite seguir haciendo cambios, como añadir muebles y decoración a una habitación para probar ideas. También puede mezclar diseños, añadir un patrón de una imagen a un objeto de otra, o mezclar una persona y una mascota en una nueva escena.

Los precios son transparentes para los desarrolladores: Gemini 2.5 Flash Image cuesta 30 dólares por un millón de fichas de salida. Cada imagen cuenta como 1.290 tokens de salida, lo que se traduce en aproximadamente 0,039 $ por imagen. Otras modalidades de entrada y salida siguen la tarificación estándar de Gemini 2.5 Flash.

Por seguridad, las imágenes generadas incluyen una marca AI visible y una marca de agua digital SynthID invisible. Google afirma que SynthID aún puede detectarse tras las ediciones habituales, lo que debería ayudar a verificar el origen de las imágenes a medida que los medios sintéticos se vuelven más difíciles de reconocer.

Google afirma que las primeras previsualizaciones lo califican como un modelo líder de edición de imágenes. La edición integrada en la aplicación Gemini mantiene ahora los detalles sutiles de sus fotos. Puede subir una foto, solicitar cambios, combinar imágenes con su mascota, intercambiar fondos para probar nuevos fondos de pantalla o situarse en diferentes escenas. También puede utilizar la imagen editada en Gemini para crear un vídeo corto.

Fuente(s)

Google (en inglés)

Please share our article, every link counts!
Mail Logo
> Análisis y pruebas de ordenadores portátiles y móviles teléfonos > Noticias > Archivo de noticias > Archivo de noticias 2025 08 > Google presenta Gemini 2.5 Flash Image "nano-banana" con mayor consistencia de edición
Nathan Ali, 2025-08-28 (Update: 2025-08-28)