La IA creativa continúa desarrollándose constantemente, volviéndose cada vez más compleja, funcional y sorprendente. Gracias a OpenAI, la empresa que creó un auténtico furor por esta tecnología, Sora, es esencialmente una herramienta de inteligencia artificial capaz de crear un vídeo de hasta un minuto de duración a partir de texto. Es decir, simplemente crea una descripción textual del vídeo que quieres crear -un mensaje, como se llama en ChatGPT y Dall-E- y Sora hará su magia y presentará un vídeo más que coherente pero que también tenga una alta calidad de imagen.
Sora es el resultado de un proceso de entrenamiento por el que debe pasar la inteligencia artificial para poder comprender el mundo en movimiento. El objetivo, como afirma OpenAI, es ayudar a resolver problemas que requieren interacción del mundo real. Basado en los modelos ChatGPT y Dall-E, Sora es un modelo distribuido que utiliza una arquitectura transformadora y además tiene un profundo conocimiento del lenguaje.
Esta combinación de elementos no sólo permite crear vídeos a partir de indicaciones complejas, manteniendo la fidelidad de lo requerido, sino también ampliar vídeos existentes o incluso animar imágenes estáticas. Actualmente, Sora está siendo probado por un grupo selecto de personas, incluidos artistas, cineastas, diseñadores, profesores y responsables políticos. Asimismo, para garantizar el uso más saludable y adecuado posible, expertos en desinformación, sesgos y discursos de odio han probado en tiempo real el modelo en entornos hostiles y descubriendo así posibles debilidades.
Como suele ocurrir con cualquier tecnología nueva, es imposible predecir cómo se podría explotar o abusar de Sora si estuviera ampliamente disponible para el público. Además de probar este nuevo modelo, OpenAI agregará clasificadores de texto para rechazar mensajes que incluyan violencia extrema, escenas sexuales, retratos de celebridades, direcciones IP de terceros o fotografías hostiles. OpenAI también informó que está trabajando en el desarrollo de una herramienta que pueda identificar videos producidos por Sora, lo que podría evitar el abuso de este modelo cuando se trata de deepfakes.
Si bien los ejemplos presentados son impresionantes, Sora no es un modelo perfecto de generación de video, ya que se observan errores en complejas cadenas de causa y efecto y confusión espacial. Sora es una herramienta que tiene el potencial de enriquecer campos como el cine y las artes visuales, pero al mismo tiempo también puede causar estragos. Es una buena señal que OpenAI haya decidido pasar algún tiempo aquí.