Home Tecnología Google Gemini mejoró mucho en ‘Photoshopping’, y estoy preocupado

Google Gemini mejoró mucho en ‘Photoshopping’, y estoy preocupado

25
0

¿Sabía que puede personalizar Google para filtrar la basura? Tome estos pasos para obtener mejores resultados de búsqueda, incluida la adición de Lifehacker como fuente preferida de noticias tecnológicas.

Google actualizó su aplicación Gemini (y sitio web) para hacer que la generación de imágenes sea un poco más intuitiva, y por una vez, lo que anteriormente descarté como una novedad podría ser una alternativa viable de Photoshop. Todavía hay una basura de IA típica, pero el nuevo modelo, probado bajo el nombre “nano plátano“Y ahora vive para todos los usuarios de Géminis como una imagen flash Gemini 2.5, hace mucho para permitirle ajustar una imagen a su gusto. Todo todavía tiene una marca de agua y advertencias” hechas con IA “en los metadatos, pero prepárese para ser mucho más discernimiento sobre si una foto es real o no, los nuevos Gemini.

Google Gemini ahora es mejor en la edición de fotos reales

Lo que hace que el modelo actualizado sea tan especial es un enfoque en mantener detalles en múltiples fotos. Ahora, en lugar de generar esencialmente desde cero cada vez que le pide a la aplicación Gemini una foto, puede transferir partes de una foto de origen o una imagen generada previamente y solo cambiar lo que le pide. Hay dos grandes razones por las que eso importa, e irónicamente, una de ellas en realidad significa usar menos IA.

Por ejemplo, supongamos que tienes una foto tuya con una camisa roja, pero quieres que sea azul. Anteriormente, tenía dos opciones: tenía que llevar la imagen a Photoshop tú mismo y ajustarla manualmente, o usarla como un aviso para la IA y seguir generando hasta que obtuviera algo que se veía lo suficientemente cerca de la foto original, pero ahora con la camisa de azul. Con los cambios en Nano Banana, Google ajustó su modelo para que deje la mayor parte de su imagen solo, y solo cambia la camisa.

Crédito: Michelle Ehrhardt, Google

Como ejemplo, aquí está esa situación exacta, con un par de fotos mías. Observe cómo el modelo mantiene detalles finos como el frizz de mi cabello o mi expresión facial específica y pose. No es perfecto, y notarás que mi piel realmente se ve un poco más suave en la versión editada, pero con las nuevas actualizaciones, Gemini ahora puede determinar lo que quiero decir con “camisa” y enfocar la mayoría de sus ediciones en eso. Diré que la camisa también se ve un poco antinatural, específicamente alrededor de mi hombro derecho, pero tampoco le di a Gemini mucho para trabajar en mi aviso. Ahí es donde entra el próximo gran cambio.

Use Gemini para editar el mismo resultado varias veces

Aquí es donde está el verdadero truco. Ya sea que una imagen esté completamente generada por la IA o no, ahora puede usar imágenes previamente generadas como base para las generaciones futuras. En otras palabras, si Gemini no tenía algo bien la primera vez, puede pedirle que lo intente nuevamente hasta que lo haga.

Para darle una idea de cómo se ve, aquí está la misma foto mía en la camisa azul, pero ahora con lunares agregados, para combinar mejor la camisa roja de la foto original.

Crédito: Michelle Ehrhardt, Google

Y aquí hay una imagen completamente generada por la IA de una gata, que cambiaba a Géminis a Orange.

Crédito: Google

Esto es enorme para la generación de imágenes de IA. Anteriormente, al pedirle a Gemini que haga pequeños ajustes para el contenido que ya está generado, esencialmente obtendrá fotos nuevas cada vez, como es el caso de estos perros con sombreros.

Crédito: Google

Ahora, sin embargo, puede tener la aplicación en la misma foto varias veces, lo que significa que si el resultado inicial parece poco convincente, tiene la oportunidad de solucionarla. Para mí, eso lleva esto a ser una novedad, donde esencialmente tienes que girar una rueda con cada generación y esperar que aterrice en algo útil, a una amenaza genuina de Photoshop.

Google sugiere, por ejemplo, que podría usar esto para ver cómo se vería si viviera en una década diferente o tuviera una carrera diferente. Admito que los resultados se ven lo suficientemente convincentes como para trabajar para publicaciones casuales, especialmente si subes una foto real como contexto. Aquí está yo de pie junto a la vida real Mona Lisa, pero reimaginé como artista.

Crédito: Michelle Ehrhardt, Google

Eso no es estrictamente realista (¿por qué hay una segunda Mona Lisa a mi lado?), Pero pude ver a un cierto tipo de persona sacando lo suficiente que inundan las redes sociales con publicaciones como esta. Pase un tiempo iterando sobre él, y probablemente incluso podría hacer que parezca que iba al Louvre.

Pero si eres un escéptico de IA como yo, todavía hay una gracia salvadora que muestra que el modelo tiene un poco de espacio para crecer.

¿Qué piensas hasta ahora?

Combinar fotos todavía no está del todo bien

Si bien las nuevas actualizaciones de Géminis hacen que se itere en las fotos existentes mucho más viables, pidiéndole que genere un nuevo contenido, donde no puede confiar demasiado en una foto fuente, todavía le da un brillo AI notable. Una de las características adicionales que Google anunció con esta actualización era la capacidad de usar Gemini para combinar múltiples fotos de origen en una. Pero si bien los otros cambios implican principalmente hacer pequeños ajustes para las fotos existentes, este todavía requiere que la IA invente mucho para armar las fotos, y es aquí donde es más probable que tenga los mismos viejos problemas.

Crédito: Michelle Ehrhardt, Google

Por ejemplo, siguiendo uno de los ejemplos sugeridos de Google, subí una foto de mí y de mi gato a Géminis, y le pedí que hiciera una foto de nosotros abrazándonos juntos. Pero mientras que las otras pruebas que hice con esta actualización se parecían mucho a las fotos de origen, el resultado aquí me dio una versión de mí mismo en una camisa demasiado ajustada, con cabello demasiado brillante, abrazando a un gato demasiado encantador. Los trazos anchos eran correctos: mi cara todavía se parece principalmente a mí, el patrón de piel de mi gato está aproximadamente intacto y el sofá incluso tiene el color correcto y la forma general. Pero además de algunas pequeñas inconsistencias con, por ejemplo, los pliegues en el sofá, mis hoyuelos, o la lámpara en el fondo (que parece tener dos polos), cualquiera que haya conocido a mi gato sabe que no es tan grande. La foto también tiene ese aspecto de vaselina y sobreprocesado que es endémico para la IA.

Hasta cierto punto, es de esperar. No subí demasiadas fotos, y ciertamente ninguna de mí o mi gato en las poses presentadas en la imagen de IA. La IA no tenía forma de saber cómo nos veríamos desde diferentes ángulos, especialmente porque mi selfie era solo un tiro en la cabeza. Pero lo que obtuve significa que cuando la IA se queda sin información útil de la fuente y necesita intuir cómo debe verse una escena, todavía se encuentra en problemas familiares que hacen que sea bastante fácil distinguir de las fotos hechas sin IA. Probablemente podría hacer que la foto de IA sea más realista si subiera fotos de origen más cerca de lo que Géminis quería generar, claro, pero entonces tengo que preguntarme cuál sería el punto de involucrar a la IA en el proceso de edición.

En cualquier caso, puedo decir con confianza que hacer que las ediciones de IA avanzadas parezcan convincentes aún tomarán un poco de intervención humana.

Prepárate para una mezcla de IA y realidad

Las nuevas actualizaciones de Gemini son, para mí, más impresionantes cuando se usan para ajustes más pequeños, que es realmente donde creo que entra la amenaza para Photoshop. Me gusta pensar que tengo una habilidad especial para detectar fotos generadas por IA, pero en un pergamino rápido, no estoy seguro de que la imagen de mí en una camisa azul plantee cualquier campana de alarma.

¿Qué significa eso? Bueno, por ejemplo, significa que las herramientas de IA gratuitas finalmente están en el punto en que podría usarlas para ver con un mensaje de lenguaje natural lo que podría haber tardado unos minutos para hacer a mano antes. Adobe ya ha dicho que planea incorporar nano plátano En Photoshop, pero prepárate para más cambios a aplicaciones tradicionalmente intocables a medida que avanza la IA. Es en el punto en que, al menos para las cosas pequeñas, realmente puede amenazar su flujo de trabajo tradicional.

Para las personas que no son creadores de contenido, espere tener que desarrollar un ojo aún más exigente sobre lo que es y no es real en línea. Si bien las imágenes completamente fabricadas con AI a menudo son bastante fáciles de detectar, y las ediciones más realistas pueden ser en su mayoría inocuas (a nadie le importará el color de mi camisa), las actualizaciones de Gemini ahora hacen que sea más fácil que nunca combinar la realidad con solo un poco de falsedad. Aquí hay una imagen que tenía el nuevo Géminis de Taylor Swift en una gorra de béisbol roja, si me atrapas.

Crédito: Google

Mientras esperamos para ver cómo se desarrolla esto, es un buen momento para recordar que si una imagen se pone en marcha las campanas de alarma, Gemini coloca marcas de agua de AI en la esquina inferior izquierda de todos sus resultados, y marcará fotos generadas usando en sus metadatos, que puede ver en iPhone y Android deslizando en una foto descargada. Hay formas de fregar metadatos, pero como alternativos, porque es probable que las ediciones más convincentes usen fotos reales como sus fuentes (Hice Para el Taylor Swift anterior), como último recurso, también puede usar una búsqueda de imágenes inversas de Google para tratar de encontrar el original inalterado. Ten cuidado por ahí.

Fuente de noticias