Compañía china presenta alucinante generador de videos

Comparta este Artículo en:

La herramienta es capaz de generar hasta 16 segundos de video en una resolución máxima de 1080p.

OpenAI parece estar marcando el ritmo del desarrollo de la IA generativa. Después del lanzamiento de ChatGPT en noviembre de 2022 asistimos al lanzamiento de una oleada de chatbots alternativos como Gemini de Google y Claude Chat de Anthropic.

La compañía dirigida por Sam Altman presentó en febrero de este año un generador de videos llamados Sora.

Y claro, el movimiento de la industria ha sido fácil de predecir: las compañías tecnológicas están trabajando para entrar a competir en la generación de video.

El material que OpenAI mostró de Sora dejó a muchas personas sorprendidas, incluidos editores de videos profesionales.

Hasta el momento no habíamos visto nada parecido. El modelo no solo podría generar videos, sino también simular nuestro mundo.

Pero, al igual que está sucediendo con los chatbots, tenemos razones para creer que es cuestión de tiempo que aparezcan herramientas con similares capacidades.

Adobe ya está trabajando en su propio generador de videos, pero no todo nace en Estados Unidos.

Las compañías chinas también están trabajando incansablemente en este sentido.

La Shengshu Technology y la Universidad de Tsinghua han presentado al mundo un generador de videos llamado Vidu.

Estamos frente a una herramienta basada en inteligencia artificial que convierte indicaciones textuales simples en fragmentos de video de hasta 16 segundos de duración (frente a los 60 segundos de Sora) con una resolución máxima de 1080p.

La compañía asiática no duda en comparar indirectamente su herramienta con la desarrollada por OpenAI.

En otras palabras, han tomado el concepto de algunos de los clips de Sora y nos han mostrado cómo se verían con Vidu.

Se trata de escenas con cierto grado de complejidad para una IA.

Por ejemplo, un ojo humano en plano detalle, un vehículo pasando por un bosque, televisores apilados, una mujer caminando de noche por una ciudad iluminada por luces de neón, entre otras escenas.

A simple vista Sora parece ser una herramienta capaz de arrojar resultados de mejor calidad.

Sin embargo, en este punto debemos hacer una importante mención: ninguna de las dos alternativas está abierta al público en general, por lo que no se pueden probar aún.

Los creadores de Vidu señalan que su modelo tiene una serie de características muy destacadas.

Aseguran que, al igual que Sora, puede simular el mundo físico.

También dicen que puede crear escenas consistentes y que es capaz de comprender elementos chinos.

Fuente: Global Times