Resumen
Google presentó Flow, una IA multimodal para el cine, y mostró sus aplicaciones en E/S 2025. Flow combina Gemini, Veo e Imagen para crear videos, mejorar la narración de historias. Flow ofrece edición cinematográfica, recorte y soporte rápido multimodal para profesionales de narración de historias junto con la expansión de la escena y otras características.
Google sacudió las bases de lo que podríamos esperar de la inteligencia artificial y los modelos generativos en los próximos meses. En su última conferencia para desarrolladores, E/S 2025, Google habló más sobre Géminis que AI, en general. Además, mostró nuevas aplicaciones pioneras para TI, en modo AI para el negocio de búsqueda heredado, soporte en Chrome y más. Para los creativos que no serían saciados por los últimos modelos de Imagen o Géminis, Google dio a conocer el flujo, una poderosa suite de creación de video que depende totalmente de VEO 3 y otros modelos para ayudar a los usuarios a crear historias.
Google Gemini relacionado: todo lo que necesita saber sobre la IA multimodal de próxima generación de Google
Google Gemini está aquí, con un enfoque completamente nuevo para la IA multimodal
No te culpamos si el torbellino de los nombres de Google por su arsenal ai se vuelve complicado de navegar. Si bien Gemini es el pilar de las aplicaciones cotidianas para potencialmente miles de millones de usuarios, la compañía ha invertido esfuerzos en el desarrollo de modelos específicamente para profesionales creativos. Imagen es un generador de imágenes especialmente diseñado, mientras que VEO convierte las mismas entradas textuales en video. Google VEO 2 Generó video sin audio, pero en E/S esta semana, la compañía presentó VEO 3 que administra audio-video sincronizado.
Flow, el nuevo modelo, aparentemente lleva el nombre del estado de enfoque de Trance, la mayoría de los creativos, el apalancamiento para ofrecer su mejor trabajo. Esencialmente, es una combinación de Géminis, VEO e Imagen juntos, culminando en el sucesor de VideOfX. Google no es palabras mordiendo cuando dice que estos son los primeros días para el flujo, pero el modelo ya puede convertir las indicaciones textuales a las imágenes, luego usar las imágenes juntas para hacer un video corto, recortar la escena y, por último, agregar escenas posteriores o anteriores mediante enjuague y repetición.
Totalmente equipado para narración cinematográfica
Tejer magia con tus palabras
Los cinematógrafos pueden usar el flujo para llamar a las tomas por nombre, especificar detalles adicionales para cada clip que crean e incluso llegar a especificar cómo la cámara virtual debe moverse a lo largo de la toma. Google dice que las salidas se adherirán a las indicaciones y entregarán “impresionantes resultados cinematográficos que se destacan en la física y el realismo”. Si le preocupa luchar con la generación de imágenes, el flujo también permite la fusión de arte generado con imágenes u otros activos que creó de forma independiente.
Mi elemento favorito es una reminiscencia de la aplicación de edición de fotos propiedad de Google Snapseed, donde puede expandir el marco más allá de lo que capturó. Del mismo modo, el flujo permite recortar o estirar cualquier clip generado, y el flujo creará un nuevo final para él, completo con soporte multimodal de solicitación si tiene una dirección para la historia en mente.
Flow ya se está implementando en Google AI Pro y Ultra suscriptores en los Estados Unidos, con apoyo para más países en la hoja de ruta. Dada la naturaleza intensiva en recursos del procesamiento de videos de IA, no creemos que este modelo esté disponible para niveles de suscripción más asequibles en el corto plazo. Eso es reiterado por el límite duro de 100 generaciones por mes para los usuarios de Pro, mientras que los clientes Ultra obtienen soporte VEO 3 con generación integrada de audio para mayor realismo.









