Después del anuncio de la semana pasada, la edición de imágenes nativas en la aplicación Gemini ahora está viendo una disponibilidad más amplia.
Anteriormente, si tenía Gemini que generara una imagen y luego pidió un cambio, se creó una imagen completamente nueva:
Viejo (diferente perro, fondo, nubes, etc.)
La edición de imágenes nativas mantiene la imagen base mientras realiza cambios específicos a través de indicaciones de lenguaje natural. Esto funciona tanto para imágenes generadas como para las que subes directamente a Géminis. Con un mensaje de texto, puede cambiar fondos y estilos, reemplazar objetos y agregar elementos, incluido el texto.
Anuncio – Desplácese por más contenido
En el ejemplo a continuación, la segunda imagen es idéntica (incluido el perro, los árboles en el fondo, el cielo, etc.) al primero, excepto la hierba azul.
Nuevo
También notará cómo las imágenes generadas ahora presentan una marca de agua visual “AI” en la esquina inferior derecha. Esto es algo que Google está probando, y se une a la marca de agua Invisible Synthid Digital.
Google también dice: “Puedes subir una foto personal y pedirle a Gemini para generar una imagen de lo que te verías con diferentes colores de cabello”.
Esta edición de varios pasos, que preserva el contexto a lo largo de la conversación, también hace posibles “indicaciones con texto e imágenes integradas”. Ejemplos de eso incluyen instrucciones paso a paso con imágenes, o un “primer borrador de una historia para acostarse sobre dragones y proporcionar imágenes para acompañar la historia”.
Está alimentado por Gemini 2.0 Flash, pero puede invocar esta herramienta/capacidad en cualquier modelo. A partir de hoy, estamos viendo una disponibilidad más amplia de la aplicación Gemini de edición de imágenes en los EE. UU. En varias cuentas gratuitas y avanzadas.
Para los desarrolladores, Google anunció hoy que Gemini 2.0 Flash Image Generation and Editing ahora está en vista previa para los desarrolladores. Gemini-2.0-Flash-Preview-Image-Generation está disponible a través de la API de Gemini en Google AI Studio y Vertex AI hoy. En comparación con la prueba de marzo, Google promociona mejoras como:
Mejor calidad visual (versus versión experimental) Representación de texto más precisa (versus versión experimental) Tasas de bloqueo de filtro significativamente reducidas (frente a versión experimental)
FTC: Utilizamos ingresos que ganan enlaces de afiliados para automóviles. Más.








