Home Tecnología No estás preparado para esta nueva y aterradora ola de videos generados...

No estás preparado para esta nueva y aterradora ola de videos generados por la IA

55
0

No quiero ser alarmista, pero creo que es hora de comenzar a asumir que todo lo que ves en línea es falso.

Internet está lleno de contenido producido por personas reales, por supuesto (este artículo incluido). Pero los medios generados por la IA se están volviendo tan realistas que casi te pone en desventaja para presumir el contenido que estás desplazando en tus feeds es legítimo.

No se salte este artículo porque sabes cómo se ve el contenido de IA: las cosas actuales que tu algoritmo ofrece a tus alimentos en las redes sociales es fácil de detectar si sabes lo que estás buscando. Pero incluso si puede identificar la AI Slop en el momento en que golpea sus globos oculares, debe saber que no está listo para la próxima ola de videos generados por IA. Esa ola no es solo en camino, ya está aquí.

El contenido de IA ya está engañando a la gente

La mayoría de nosotros somos muy conscientes del “video AI” Look: este video “trágico” de un padre de gato que ahorra a su gatito tirándolo de un avión en llamas es obvio a la AI para la mayoría de los que lo ve. Probablemente sepa que Trump no está trabajando en este sitio de construcción, y seguramente puede entender que esta familia de agricultores de gatos es, de hecho, generado por IA.

Pero están los videos que no son tan obvios, especialmente para aquellos de nosotros no tan en sintonía con la IA o la tecnología en general. Es posible que sepa que este video de bebés bailando en un círculo es AI, pero muchas personas en los comentarios no (suponiendo que tampoco sean bots). También puede decir que esta familia de mascotas no es realmente ver a un pájaro investigar un cocodrilo de juguete, pero, nuevamente, muchos no pueden. Y no hay fin para los videos de talento de Estados Unidos que presentan imágenes “realistas” pero imposibles, que aún capturan los corazones de cientos de miles, si no millones de personas. (Lloro).

Pero no estoy escribiendo esta pieza hoy porque me preocupa cuántos de estos videos de IA “creíbles” están engañando a demasiadas personas para que piensen que son reales. Estoy preocupado por eso, pero esas preocupaciones palidecen en comparación con mis nuevos miedos.

Hasta ahora, la mayoría de los videos de IA que se hagan cargo de los alimentos en las redes sociales dependen principalmente de sus imágenes y sonidos de fondo para vender su supuesta autenticidad. Notarás que ninguno de los personajes de ninguno de estos videos realmente habla. Si lo hacen, es inmediatamente desagradable, con movimientos de labios fuera de sincronización y, típicamente, voces robóticas. Ha sido más fácil para los creadores de IA poner el énfasis en el realismo de las personas y los animales en sus videos, y espero que un bebé baile con un león para no pensar: “Esto es una mierda, ¿verdad?”

Incluso el modelo de video SORA de Openai, que me sorprendió con su calidad en febrero del año pasado, estaba trabajando en sus imágenes realistas. Un video de una mujer “filmando” su reflejo a través de una ventana de tren demasiado real para la comodidad, pero Sora no estaba escupiendo conversaciones totalmente renderizadas. Si ve tal escena en sus feeds, probablemente suponga, por supuesto, es un video real, o al menos uno generado por humanos.

El video de IA está a punto de cambiar por completo

Algo sucedió esta semana que solo me hizo más pesimista sobre el futuro de la verdad en Internet. Durante el evento de E/S de Google de esta semana, Google presentó VEO 3, su último modelo de video de IA. Al igual que otros modelos competitivos, VEO 3 puede generar secuencias altamente realistas, que Google mostró a lo largo de la presentación. Claro, no es genial, pero también, nada realmente nuevo allí.

Pero Veo 3 no solo es capaz de generar video que podría engañar a su ojo para pensar que es real: Veo 3 también puede generar audio para ir junto al video. Eso incluye efectos de sonido, pero también diálogos: diálogo sincronizado con LIP.

Para demostrar las capacidades de audio/video de VEO 3, Google mostró un clip de un viejo marinero en el mar. La calidad del video es nítida y realista, y las palabras que habla el hombre se sincronizan con los movimientos de sus labios. Por supuesto, sabiendo que el video es AI, notas peculiaridades que regalan el juego (a mí, esto parece una animación de alta calidad más que una toma de acción en vivo), pero estoy bastante seguro de que este video engañaría a muchos fanáticos de los videos falsos de AGT.

Pero incluso este clip no fue lo que inspiró mis nuevos miedos: fueron los videos que los usuarios comenzaron a hacer una vez que tenían en sus manos Veo 3. Petapixel tiene un gran resumen de algunos de los “mejores” videos Veo 3 que las personas han hecho hasta ahora, pero destacaré algunos de los que más deberían asustarte.

Este clip muestra un streamer tocando Fortnite. Todo, incluida el metraje del juego, se generó con la IA de Google:

Este tweet no está disponible actualmente. Puede estar cargando o ha sido eliminado.

Este clip muestra tres conciertos que nunca sucedieron, con músicos y multitudes que no existen. La música no es buena, pero ese no es el punto. La música, desde las voces hasta los instrumentales, fue generada completamente por la IA, y luego se sincronizó con labios, tambores, guitarras y cuerdas:

¿Qué piensas hasta ahora? Este tweet no está disponible actualmente. Puede estar cargando o ha sido eliminado.

Pero este clip es, sin duda, el que debería sonar la alarma para todos y cada uno de nosotros. Alguien generó un video falso de un programa de autos falsos, con entrevistas falsas con asistentes falsos. Está lejos de ser perfecto, pero las peculiaridades AI están totalmente eclipsadas por el realismo a nivel de superficie aquí. Los fanáticos de AI Got Talent no solo comprarían esto, lo compraría, especialmente si no lo estuviera cuidando:

Este tweet no está disponible actualmente. Puede estar cargando o ha sido eliminado.

Son las imágenes; Es el diálogo; son las multitudes; Es la iluminación; Es la risa sincera en “errores”; Es el sonido del micrófono “golpeado”. Felicitaciones por notar el diálogo a menudo no tiene sentido, o que las personas en el fondo desafían las leyes de la física: no lo notará cuando llegue a la mitad del desplazamiento en Tiktok o Instagram.

Incluso Veo 2, que no es tan poderoso como VEO 3, ahora ofrece herramientas para el realismo, como la capacidad de dictar cómo desea que la cámara se mueva. Y ambos modelos están disponibles en flujo, el editor de video de AI de Google. Los creadores ahora tienen la capacidad de generar contenido de IA altamente realista que parece que fue filmado en persona, y la tecnología solo está mejorando.

Este tweet no está disponible actualmente. Puede estar cargando o ha sido eliminado.

Las mejores herramientas de generador de video de AI de Google cuestan $ 250 al mes a través de su nuevo plan de suscripción AI Ultra. Eso es costoso, pero no fuera del alcance de muchas personas interesadas en hacer contenido generado por IA. Pero el plan de $ 20 por mes, AI Pro, todavía viene con VEO 2 y Flow Access. Los límites de velocidad son más bajos, pero no me sorprendería ver que también salga una pendiente realista de esas limitaciones.

Es hora de ser un escéptico a tiempo completo

Nada de esta tecnología es perfecta. No estoy aquí para decirte que todo lo que Veo 3 escupe es indistinguible del contenido real, o que los videos están ausentes de cualquiera de las AI habituales. De hecho, claramente hay algo con los datos de entrenamiento de Veo 3: como informa 404 Media, el modelo genera continuamente la misma “broma de papá” cuando pides una generación de un comediante que realiza standup.

Lo que digo es que es hora de encender sus detectores de mierda y mantenerlos activos a tiempo completo. Cuando se involucra con videos en Internet, especialmente clips algorítmicos de forma corta, podría estar más seguro operando bajo la suposición de que el contenido es falso desde el salto, y requiere pruebas más allá de una duda razonable de que lo que está viendo no fue generado con un presupuesto simple y un presupuesto de $ 250. Eso se siente extremo, pero después de lo que he visto esta semana, realmente no veo otra forma de interactuar con este contenido en el futuro.

Estamos en territorio aterrador ahora. Hoy, son demos de músicos y streamers. Mañana, es un político que dice algo que no hicieron; un sospechoso que comete el crimen del que están acusados; Un “reportero” que te alimenta a través de las “noticias”.

Espero que esto sea tan bueno como la tecnología. Espero que las empresas de IA se queden sin datos de capacitación para mejorar sus modelos, y que los gobiernos tomen algunas medidas para regular esta tecnología. Pero al ver que los republicanos en los Estados Unidos aprobaron un proyecto de ley que incluía una prohibición de las regulaciones de IA justificadas durante diez años, soy bastante pesimista en ese último punto.

Con toda probabilidad, esta tecnología mejorará, con cero barandillas para garantizar que avance de manera segura. Me pregunto cuántos de esos políticos que votaron sí en ese proyecto de ley vieron un video generado por IA en su teléfono esta semana y no pensaron en nada.