MADRID, 8 de marzo (Portaltic/EP) – Los antiguos alumnos de Google DeepMind y TikTok han desarrollado una nueva herramienta de inteligencia artificial (IA) general capaz de crear vídeos de dos segundos a partir de descripciones de texto breves en calidad HD, de forma similar a como funciona Google Sora. Sora es una herramienta creada por OpenAI que puede crear escenas de vídeo realistas de hasta 60 segundos de duración a partir de instrucciones de texto, con resultados detallados, movimientos de cámara complejos y múltiples personajes emotivos. Antiguos alumnos de los equipos de desarrollo de Google DeepMind, TikTok y otros laboratorios de investigación universitarios han desarrollado una herramienta que ofrece funciones similares a las de Sora de forma gratuita.
Dos de sus desarrolladores, Yishu Miao y Ziyu Wang, explicaron en una entrevista para TechCrunch que comenzaron a trabajar en esta empresa Haiper en 2021 y la lanzaron en 2022, apostando inicialmente por la reconstrucción 3D mediante redes neuronales. Sin embargo, durante su investigación descubrieron que estaban más interesados en crear vídeos por lo que terminaron desarrollando varias funciones de IA sintética, entre ellas una solución que permite crear vídeos de alta calidad (HD) a partir de breves descripciones de texto. Para utilizar esta herramienta, debes iniciar sesión con una cuenta de Google o Discord, luego se presentarán diferentes opciones para crear contenido Haiper: desde esta última característica hasta animar imágenes o volver a dibujar videos, junto con otras opciones.
Cuando eliges la opción de crear un video con texto, se abrirá una ventana donde deberás describir cualquier video que puedas imaginar en texto, donde se mostrarán los temas sugeridos para el video. Por ejemplo: “Steampunk”, “Lego” o “Impresionismo”. Además del botón ‘Crear’, que debe presionarse al ingresar una descripción de texto, hay otras dos opciones.
El primero de ellos muestra un icono de ojo y permite a los usuarios decidir si quieren que sus vídeos sean vistos de forma privada o pública para que otros usuarios puedan verlos a través del botón ‘Explorar’. De igual forma, hay un botón que te permite elegir la duración del vídeo. Actualmente puede durar dos segundos, aunque la compañía está trabajando en un formato de cuatro segundos, que según la página de herramientas estará disponible próximamente.
Los investigadores admitieron en una entrevista con TechCrunch que, aunque Haiper se centra en un sitio orientado al consumidor, esperan crear un modelo básico de creación de vídeos que pueda ofrecerse a terceros. Para ello, comenzaron a trabajar con otro grupo de desarrolladores para probar su interfaz de programación de aplicaciones (API) cerrada. Además, consideran publicar el código fuente de sus modelos para permitir a los usuarios explorar diferentes casos de uso de IA.