nano banana

Nano Banana: ¿la edición de imágenes revolucionaria con Gemini? – Noticias de IA

Google está implementando un nuevo modelo de IA en su aplicación Gemini, Nano Banana, que revolucionará la edición de fotos. A diferencia de los generadores típicos, su punto fuerte reside en la modificación de imágenes existentes, con una capacidad sin precedentes para mantener el parecido del sujeto y permitir ediciones conversacionales en varios pasos. Sin embargo, las pruebas iniciales de los usuarios revelan que, junto a éxitos espectaculares, la tecnología todavía tiene dificultades: los intentos de fusionar fotos dan como resultado collages surrealistas y realizar cambios precisos se siente como una frustrante negociación con el algoritmo. ¿Es Nano Banana el verdadero futuro de la edición de imágenes o solo una herramienta fascinante pero aún por pulir?

Después del modelo Imagen 4, que se centraba en generar imágenes desde cero, llega el momento de una herramienta que pretende transformar nuestro enfoque de la edición gráfica. Esta vez, el foco está en la edición de gráficos ya existentes. Presentamos Nano Banana, un modelo que, según los anuncios, está destinado a convertirse en la herramienta de edición mejor valorada del mundo. Las promesas son grandes, ¿y las primeras impresiones de los usuarios? Bueno, son variadas, pero extremadamente prometedoras.

El mundo de la IA nos ha acostumbrado a avances continuos que cambian nuestra percepción de la tecnología semana tras semana. Nano Banana es el siguiente paso en este fascinante viaje. En lugar de crear imágenes desde cero, este modelo se especializa en modificarlas. Es como una conversación con un diseñador gráfico inteligente que entiende nuestras órdenes y las hace realidad. Al menos en teoría. En la práctica, como con la IA, nos enfrentamos a un emocionante viaje por el valle del asombro, lleno tanto de éxitos espectaculares como de fracasos cómicos.

¿Cómo funciona Nano Banana y cómo usarlo?

Para empezar la aventura con la nueva función, no es necesario instalar ningún plugin adicional ni buscar opciones ocultas en el menú. Toda la magia ocurre directamente en la ventana de chat de la aplicación Gemini. Solo tienes que subir una foto —ya sea generada previamente por IA o recién hecha con el móvil— y describir el cambio que quieres. Este enfoque, conocido como edición conversacional, es el núcleo de esta innovación. Google destaca especialmente varias capacidades nuevas que redefinirán nuestro enfoque de la edición de fotos.

Sigues siendo tú, incluso con un peinado retro

Uno de los mayores desafíos para los modelos de IA hasta ahora ha sido la coherencia. ¿Cuántas veces has intentado cambiar el fondo de una foto solo para obtener una imagen en la que tu cara parece una caricatura de otra persona? Nano Banana pretende resolver este problema. Google ha puesto un gran énfasis en mantener la identidad de los personajes editados.

Los usuarios que ya han tenido la oportunidad de probar la nueva función a menudo expresaron su asombro. Los intentos de cambiar la ropa, reubicar a los personajes en lugares completamente diferentes —por ejemplo, de una oficina a la cima de una montaña— o incluso los experimentos con peinados locos terminaron sorprendentemente bien. Los rasgos faciales sutiles, la disposición característica de los ojos e incluso las pequeñas imperfecciones de la piel permanecieron intactos. Esto hace que las fotos editadas conserven su carácter personal. Por fin puedes ver cómo quedaría tu perro con una falda mona sin preocuparte de que la IA lo convierta en un perro de una raza completamente diferente.

 

Creative Demolition and Rebuilding: Multistage Editing

Demolición y reconstrucción creativa: edición multietapa

Imagina que estás reformando una habitación. Primero, pintas las paredes de un nuevo color. Luego, pones una estantería. A continuación, añades una mesa de centro y algunas plantas. Nano Banana permite exactamente el mismo proceso iterativo de trabajo con una imagen. Subes una foto de una habitación vacía y, paso a paso, orden a orden, la decoras según tu visión.

Esta es una de esas aplicaciones que generó más entusiasmo en una fase temprana. Los usuarios presumían de la fluidez con la que el modelo cambiaba los colores incluso en formas complejas, añadía muebles manteniendo la perspectiva o incluso coloreaba viñetas de manga en blanco y negro. Por supuesto, no siempre era perfecto al primer intento, pero unas pocas órdenes adicionales con correcciones a menudo conducían a un efecto satisfactorio. Es la herramienta perfecta para el prototipado rápido y para probar conceptos visuales sin abrir un software gráfico complicado.

Choque con la realidad: cuando la magia de Nano Banana se desvanece

Como toda nueva tecnología, Nano Banana tiene sus problemas iniciales. Junto a la admiración por la coherencia de los personajes y la edición por pasos, rápidamente aparecieron en internet historias que demostraban que la perfección aún está muy lejos. Es en estas imperfecciones donde mejor se aprecian los retos a los que se enfrentan hoy los creadores de modelos de IA.

Cuando dos mundos chocan demasiado literalmente: la frustración de fusionar imágenes

Una de las características más prometedoras se suponía que era la fusión perfecta de varias fotografías en una escena coherente. La sensación cuando nace en la mente una idea brillante para un fotomontaje creativo es emocionante. Desgraciadamente, la confrontación de esta visión con las capacidades del modelo a menudo terminaba en una decepción cómica. En lugar de una mezcla armoniosa de dos mundos, los usuarios recibían collages surrealistas donde la lógica y la física dejaban de existir.

Esta experiencia puede describirse como una pérdida en la traducción entre la intención humana y la ejecución de la máquina. Parece como si la IA, en lugar de interpretar inteligentemente la orden, superpusiera las capas de forma brutal, creando híbridos ilógicos. Los objetos se atraviesan entre sí de formas absurdas, la perspectiva se derrumba y la iluminación parece proceder de dos dimensiones diferentes. El entusiasmo inicial da paso rápidamente a la incredulidad y la risa, y la función, concebida como un gran avance, se presenta actualmente como una curiosidad que produce material para memes de internet.

«Casi» marca una gran diferencia: la lucha por el detalle y la precisión

Igualmente frustrantes son los intentos de introducir cambios pequeños y precisos. Es esa sensación de querer añadir un elemento diminuto a una foto, y que el modelo parezca tener su propia y obstinada visión de cómo debería ser y dónde debería colocarse. Una simple petición para situar un objeto en un lugar concreto se convierte en una serie de negociaciones con el algoritmo. El objeto flota, tiene la escala equivocada o se funde con el fondo de una forma que nadie había planeado.

Lo que es peor, los usuarios se dieron cuenta rápidamente de que cada intento posterior de corrección tiene un coste: la degradación gradual de la calidad de toda la imagen. Con cada edición, los detalles se vuelven más borrosos, los bordes nítidos se suavizan y todo el gráfico adquiere un aspecto «borroso» y digital. Esto convierte el proceso de edición en una carrera contra el tiempo y el número de correcciones, y el efecto final, aunque se acerque a la intención, suele ser técnicamente peor que el original. Es una sensación de luchar con la herramienta, no de cooperar con ella.

Cuestiones técnicas y éticas a tener en cuenta

Más allá de los problemas puramente funcionales, merece la pena prestar atención a otros aspectos. En primer lugar, la resolución de las imágenes generadas todavía deja que desear. Unos 1200×800 píxeles son suficientes para una publicación en redes sociales, pero resultan insuficientes para aplicaciones profesionales sin invertir en soluciones de reescalado gráfico.

En segundo lugar, la cuestión de la propiedad intelectual. Los usuarios se dieron cuenta de que las peticiones para añadir personajes conocidos de la cultura pop a menudo acaban con la creación de sus variantes extrañas y distorsionadas. Esto demuestra cómo los modelos abordan el tema de los derechos de autor, evitando crear copias exactas, lo que sin embargo conduce a resultados bastante inquietantes.

Por último, cabe añadir que Google se preocupa por la transparencia. Cada imagen editada o creada en Gemini está marcada con una marca de agua visible en la esquina y una etiqueta digital invisible SynthID. Es una señal clara de que estamos ante contenido generado por inteligencia artificial.

¿Es Nano Banana el futuro de la edición gráfica?

A pesar de las imperfecciones actuales, el potencial de Nano Banana es enorme. Es una herramienta que democratiza la edición de fotos, haciéndola más intuitiva y accesible para todos. La capacidad de mantener la coherencia de los personajes es un verdadero avance, y la edición conversacional podría convertirse en el estándar en el futuro.

Por ahora, sin embargo, Nano Banana es un juguete fascinante pero todavía inacabado. Puede ser un gran ayudante para visualizaciones rápidas y experimentos creativos, pero no sustituirá a las herramientas gráficas profesionales. Se necesita más precisión, un mejor manejo de las composiciones complejas y una mayor resolución. Sin embargo, si Google mantiene el ritmo de desarrollo, podríamos ser testigos de una pequeña revolución que cambiará permanentemente nuestra forma de pensar sobre la edición de fotos. Merece la pena seguir este desarrollo, aunque por el camino nos esperen muchos resultados absurdos y cómicos.

Si tienes curiosidad por saber qué depara el futuro de la edición gráfica con IA, ¡suscríbete a la newsletter de Delante y mantente al día con nosotros!

Fuente de información sobre Nano Banana: https://blog.google/products/gemini/updated-image-editing-model/

Matt Calik CEO Delante Global Agency

Matt Calik

CEO

Matt Calik

CEO

Director ejecutivo, lleva construyendo Delante desde 2014. Responsable de las estrategias internacionales de BÚSQUEDA. Tiene un sólido enfoque analítico del marketing online, respaldado por más de 12 años de experiencia. Anteriormente estuvo vinculado al sector de las tecnologías de la información, así como a los mercados automovilístico, tabacalero y financiero. Tiene experiencia en la creación de procesos escalables basados en metodologías ágiles.

¿Listo para potenciar tus resultados?
Contacta con nuestro equipo.

Completa el formulario y nos pondremos en contacto contigo en un plazo de 24 horas.

¿Te gustaría colaborar con nosotros?

Responderemos en menos de 24 horas: ¡empecemos hoy mismo!

Por favor, activa JavaScript en tu navegador para completar este formulario.
Consentimiento de marketing