Google anuncia una IA para crear vídeos a partir de texto una semana después de que Meta haga lo mismo

La herramienta genera vídeos de hasta 5,4 segundos de duración.
La herramienta genera vídeos de hasta 5,4 segundos de duración.
Google
La herramienta genera vídeos de hasta 5,4 segundos de duración.

Después de DALL-E, la inteligencia artificial que convierte el texto en imagen de OpenAI, Google ha creado una tecnología capaz de transformar el texto en vídeos con Imagen Video. Su herramienta se anunció el pasado miércoles 5 de octubre y aseguran que genera contenido audiovisual de 1280 x 768 a 24 cuadrados por segundo. 

El invento todavía se encuentra en desarrollo, sin embargo, el comunicado ha llegado en el momento exacto, ya que hace una semana Meta presentó Make-A-Scene un servicio similar a la idea que Google propone. 

Los investigadores de Google pretenden añadir a Imagen Video algunas habilidades destacables, como producir vídeos basados en obras de pintores famosos, crear objetos en 3D con base en estructuras reales y diseñar vídeos en diferentes estilos de animación.

Con los modelos de síntesis de vídeo, los de Alphabet tienen la intención de "disminuir significativamente la dificultad de la generación de contenido de alta calidad". Como ejemplos, han publicado algunos vídeos de un helado derritiéndose por el cono, una jirafa asomándose por una televisión y un oso de peluche patinando, entre otros.

En la página web, han mostrado varios ejemplos de cómo serán los resultados de la IA.
En la página web, han mostrado varios ejemplos de cómo serán los resultados de la IA.
hGoogle

Google explica que, insertando palabras como "un oso lavando los platos", Imagen Video da como resultado un vídeo de 16 cuadros, 24 x 28 píxeles, a 3 fps. Posteriormente, el programa aumenta las resoluciones con velocidades de cuadro más altas hasta alcanzar una duración de 5,3 segundos.

Los datos de capacitación para la inteligencia artificial provienen de LAION-400M, que cuenta con 14 millones de pares de vídeo y texto y 60 millones de pares de imagen y texto. Google detalla que han entrenado a Imagen Video para que muestre contenido con estereotipos sociales, prejuicios culturales o sexualmente explícitos y violentos, pero no descarta que la tecnología siga reproduciéndolos sin querer. 

La marca señala que una de sus preocupaciones es que la herramienta termine usándose para "generar contenido falso, odioso, explícito o dañino". Por ese motivo, el proyecto todavía sigue en proceso de investigación y posiblemente tardemos en ver su lanzamiento.

Apúntate a nuestra newsletter y recibe en tu correo las últimas noticias sobre tecnología.

Mostrar comentarios

Códigos Descuento