La semana pasada, Google comenzó a implementar su modelo de generación de videos VEO 2 a los suscriptores avanzados de Gemini. He estado jugando con él desde entonces, tanto así, aparentemente ya he aumentado contra el límite mensual de Google en las generaciones de video.
En el período previo a la disponibilidad más amplia de Veo 2, Google destacó naturalmente los clips generados por el modelo que eran difíciles de distinguir de los videos de fabricación humana, ya sea que se le pidiera que imitar el metraje realista o una animación cursi. Los resultados que he visto en mi tiempo con Veo 2 no han sido tan impresionantes, pero tengo que decir que están más cerca de lo que esperaba, e incluso los peores siguen siendo interesantes. Aquí hay cinco de mis primeros resultados favoritos de VEO 2.
5 Una fiesta de tiburones en el bosque
Para este video, me involucré en la tradición tradicional de incitar a la IA generativa a crear una escena sin sentido y flujo de estilo. Le pedí a Veo 2 un video de híbridos de jarras humanas que tenían una hoguera en el bosque, sosteniendo tazas rojas. Verifique y verifique. También lo impulsé a incluir “camionetas” en la escena, suponiendo que sabría por contexto que quiso decir el tipo de camioneta que alguien podría acampar. En cambio, les dio a todos los tiburones de zapatillas reconocibles. No es exactamente lo que buscaba, pero definitivamente más divertido.
El clip de ocho segundos de personas de tiburón que bailan alrededor de un fuego es realista de manera realista, con el fuego ardiendo de manera realista, el fondo de convincentemente borrosa, y la piel de los tiburones que muestra una textura realista. Los detalles más finos no están tan limpios: cada uno parece tener una aleta normal y una mano humanoide. Las tazas de las que están en el fondo también están flotando cerca de sus manos en lugar de sostenerse en ellas. Aún así, un esfuerzo admirable por algo tan inútil.
4 Un cráneo de oro grabado
Para tener una idea de cómo Veo 2 maneja texturas complejas, le pedí un cráneo de oro con detalles finamente grabados en el estilo de una Calavera, girando bajo una luz brillante. El resultado se siente incompleto, con el cráneo haciendo un giro parcial, deteniendo, luego continuando, pero tanto la anatomía del cráneo como la forma en que la luz juega en sus diversas texturas y detalles se ven convincentes.
3 presentadores de noticias Gen-AI
Pensando en las formas en que la generación de videos podría usarse para engañar a las personas, solicité a Veo 2 a simular una transmisión de noticias por cable, con anclajes sentados en un escritorio y hablar con la cámara. En su mayor parte, los resultados son convincentes: un ancla habla mientras el otro asiente. Incluso tienen reflejos realistas en la superficie del escritorio.
Sin embargo, Veo 2 cayó en el texto en este caso: el Chyron en la parte inferior estaba destinado a leer “La generación de videos de IA está aquí. ¿Para qué sirve?” Cerca, pero no del todo. Pequeños detalles en el metraje también están un poco apagados, como la pluma de un ancla aparece y desaparece, y el otro con dos micrófonos. Sin embargo, el gráfico detrás de los Anchors se siente apropiado para un segmento de noticias de televisión sobre AI Video, con un carrete de película superpuesto en un montón de otros y ceros.
2 La leyenda de Zelda, ¿algo así?
Tenía curiosidad por saber si VEO 2 estaba entrenado en imágenes de videojuegos, por lo que para averiguarlo, lo solicité a crear escenas de algunos títulos específicos. En este, describí los momentos iniciales de la leyenda de Zelda: Breath of the Wild, en el que Link sale de una cueva para mirar sobre el paisaje desde un acantilado.
Veo 2 no pudo hacer eso específicamente, pero se ha entrenado absolutamente en las imágenes del juego. Un personaje similar a un enlace sale de una cueva y a un acantilado, con una gota de elementos en la espalda que se ve vagamente como una espada y un escudo si entrecierras. Curiosamente, la interfaz de usuario del juego está casi intacta: los elementos están todos en los lugares correctos, y el mapa en la esquina gira de manera realista como la cámara.
1 juego de ciberpunk 2077 inequívoco
Involucré a Veo 2 para un metraje de algunos juegos más después de Breath of the Wild, pero la simple pronta “juego Cyberpunk 2077” arrojó lo que parecía el resultado más preciso. La calle Rainy City, la interfaz de usuario, el pequeño avión: todo se parece mucho a Cyberpunk. Incluso hay una publicidad publicitaria lo que parece implantes cibernéticos.
Los detalles más finos son un desastre; El texto y la iconografía son ondulados y vagos, y Veo 2 parecía lanzar una animación corriendo con armas de fuego a pesar de que el personaje del jugador no se mueve en la escena. Aún así, Veo 2 sabe cómo se ve Cyberpunk 2077, y no tiene miedo de recrearlo.
La generación de videos de IA asequible está aquí
Mi primera semana con Veo 2 en Géminis se parecía mucho a mi experiencia temprana con aplicaciones de generación de imágenes de IA. La novedad de enchufar un breve aviso para obtener un video corto en un minuto o dos significa que incluso cuando los resultados son menos que estelares, todavía son interesantes de ver. Es nuevo, y es extraño, y es divertido.
Pero no estoy seguro de qué se supone que deben hacer los usuarios habituales exactamente con VEO 2 que no sea Goof Around. Teniendo en cuenta cómo es la generación de videos de IA intensivos en recursos, ofrecer VEO 2 como parte de una suscripción de $ 20 por mes no parece exactamente sostenible para Google. Además, parece que Gemini puede ofrecer una función de generación de videos “freemium” que no cuesta dinero en absoluto. Géminved Advanved me cortó durante el mes después de haber generado unos 50 clips, y una versión potencial gratuita de la función seguirá siendo más limitada.
Cualesquiera que sean las ambiciones de generación de video a largo plazo de Google, VEO 2 se está implementando en general para los suscriptores avanzados de Gemini en este momento tanto en la aplicación móvil como en la interfaz web de Gemini.








