Home Tecnología Probé el generador de video de IA de MidJourney, y es mejor...

Probé el generador de video de IA de MidJourney, y es mejor de lo que esperaba

16
0

Si bien los generadores de imágenes de IA que están integrados en los chatbots podrían haber captado la mayor parte de la atención recientemente, el motor de imágenes de IA dedicado a mitad deJourney ha mejorado y evolucionando en silencio desde su lanzamiento hace tres años. Ahora, También presenta un modelo de video.

Según MidJourney, este es otro paso para producir una herramienta de IA que es capaz de producir un simulador mundial 3D en tiempo real. El modelo V1 se ha lanzado con ese objetivo final en mente, aunque llevará un tiempo llegar allí.

El creador de videos de IA en Midjourney funciona de manera un poco diferente a otros generadores. Comienzas con una imagen, ya sea generada por IA o una que ya tienes, y Midjourney crea una animación de cinco segundos. Estos clips cortos se pueden extender, cuatro segundos a la vez y cuatro veces en total.

Como de costumbre con MidJourney, esta creación de contenido le costará tiempo (la versión de los créditos de MidJourney): un segundo de video es el mismo costo que una generación de imágenes, y los planes de mediana edad comienzan en $ 10 por mes y aumentan desde allí.

Creación de videos en MidJourney

Para crear un video en MidJourney, primero debe crear una imagen a través de la interfaz web. Ingrese su solicitud en el cuadro en la parte superior, usando el botón Sliders a la derecha para establecer algunas de las opciones, como la relación de aspecto. Sea lo más preciso posible en su aviso (hay Más consejos aquí), luego presione Enter (o haga clic en el icono Enviar) para ejecutarlo.

Como de costumbre, MidJourney le presenta varios resultados de su aviso, junto con opciones para construirlos. En estas se incluyen ahora cuatro opciones de animación para crear un video. Su primera decisión es si ir con Auto (MidJourney elige la moción que se agrega) o manual (usted describe la moción que desea).

Su segunda decisión es si ir con un movimiento bajo (el movimiento es limitado) o el alto movimiento (donde todo en el marco se mueve y los problemas técnicos son más probables). Una vez que haya hecho su elección, puede editar su solicitud nuevamente (si ha elegido el manual) y se crea el video. Al igual que con las imágenes, verá múltiples variaciones presentadas.

Haga clic en cualquiera de los videos generados, y verá las mismas cuatro opciones de animación aquí, solo estas son ahora para extender el video más, que puede hacer cuatro veces en total. Puede mezclar secciones automáticas y manuales, y secciones de baja cámara y alta cámara, para desarrollar el clip que está buscando.

Encontrará las opciones para descargar su video arriba de la solicitud a la derecha: puede descargar el video sin procesar o una versión optimizada para las redes sociales (que combate parte de la compresión que ocurre cuando publica videos en esas plataformas). Puede comenzar de nuevo haciendo clic en el mensaje original, luego haciendo cambios en él.

MidJourney es un impresionante generador de imágenes AI, y sus videos alcanzan el mismo estándar. Intenté crear un paisaje urbano de ciencia ficción y una animación de paisaje natural, y los resultados finales fueron en su mayoría consistentes y lógicos, mientras seguían de cerca las instrucciones indicadas. Algunas de las peculiaridades típicas de video generado por IA están aquí, como la física extraña, pero incluso en esta etapa temprana, el modelo V1 es pulido y capaz.

Puede ver tanto las limitaciones como las ventajas del enfoque de mediana edad en estos clips: cada segmento de cuatro segundos se mueve sin problemas hacia el siguiente, pero no tiene mucho tiempo para hacer lo que desea hacer en su video si está trabajando en ráfagas de cuatro segundos, y a medida que avanza el video, tiende a perder algunos de los detalles y la riqueza que obtiene en su imagen original.

¿Qué piensas hasta ahora?

Comparando MidJourney con Sora y Géminis

Si está pagando OpenAI $ 20 o más al mes para ChatGPT, entonces también tiene acceso a Sora. Al igual que MidJourney, Sora le permite comenzar videos desde una imagen (ya sea generada por IA o de otra manera), o con un nuevo aviso.

Hice que Sora se construya sobre la ciudad de ciencia ficción futurista y las imágenes animadas de paisajes que había creado en MidJourney, y obtuve resultados mixtos. La escena se sintió más atractiva, pero había más rarezas, como movimientos antinaturales y fondos fallidos (especialmente con la animación, que se volvió realmente extraño).

Puede usar SORA para generar videos de hasta 20 segundos de longitud, pero hay menos control sobre cómo progresa una escena que con MidJourney: básicamente solo ingresas en tu aviso y luego toma lo que sea que regreses. Para proyectos casuales, al menos, MidJourney se siente como la herramienta más accesible, capaz de resultados más realistas.

También intenté crear la misma escena en Veo 2 de Google, a través de la aplicación en línea de flujo. El flujo le permite basar sus videos en imágenes y escenas extendidas mientras mantiene la consistencia, como MidJourney (no obtiene las mismas características con VEO 2 en la aplicación Gemini). En general, diría que esto me dio los resultados más cercanos a lo que estaba buscando, aunque todavía había algunas inconsistencias y rarezas.

Puede ver que el auto volador desciende de manera creíble a través del paisaje urbano, y las instrucciones inmediatas se siguen de cerca. En cuanto a la animación, volando a través de un paisaje de dibujos animados, los resultados de Google Flow y Veo 2 fueron los mejores del grupo, aunque nuevamente puede ver que pierde gradualmente parte de la riqueza y los detalles presentes en la imagen original.

Si sus ambiciones cinematográficas de IA son un poco más grandiosas, las herramientas de Google pueden ser la mejor opción, aunque nuevamente, hay un costo: la generación de videos y el acceso al flujo le costarán $ 20 o más al mes. También puede pagar $ 250 por el plan Google AI Ultra, que le brinda acceso extendido al modelo VEO 3 más avanzado, completo con sonido (aunque VEO 3 aún no puede hacer videos basados ​​en una imagen estática).

Si bien este no es el tamaño de muestra más grande, la calidad de los clips de mediana edad es claro de ver, y el enfoque para la fabricación de video es sencillo e intuitivo. Google VEO 2 sigue siendo una mejor opción para la calidad general, mientras que por ahora Sora sigue siendo bastante caótica e impredecible. Tendrás que pasar mucho más tiempo con el modelo Operai para terminar con resultados transitables.

Fuente de noticias