Sora: qué es y cómo usar la IA de OpenAI para generar vídeos
La carrera de la IA continúa y OpenAI ha presentado su más reciente innovación: Sora. Se trata de una IA que genera vídeos a partir de texto en segundos y los resultados son increíbles. Conoce todos los detalles de esta nueva herramienta.
¿Qué es Sora y cómo funciona?
De los mismos creadores de ChatGPT y DALL-E, llega Sora, un sistema de inteligencia artificial capaz de crear vídeos realistas de hasta un minuto a partir cualquier texto (prompt) que el usuario escriba. Así como los modelos que crean imágenes a partir de texto, Sora ha sido entrenada para entender la forma en que nos expresamos para pedir algo. Asimismo, se ha preparado con una enorme biblioteca de vídeos que le permite reconocer movimientos, elementos o efectos visuales y recrearlos.
Si bien está en fase experimental, ya se dieron a conocer las capacidades de la herramienta, presentando vídeos y los comandos con los cuales se han generado. Según OpenAI, Sora puede generar vídeos de alta calidad para pantallas de 1920 x 1080 píxeles, tanto en formato horizontal como vertical. Su versatilidad queda demostrada en su capacidad para crear escenas complejas con varios personajes, movimientos de cámara específicos y detalles precisos. Además, Sora puede transformar una imagen fija en un vídeo dinámico y ampliar la duración de vídeos ya existentes.
OpenAI llama a su nuevo sistema Sora, como la palabra japonesa que significa cielo. De acuerdo con Oren Etzioni, profesor de la Universidad de Washington especializado en IA, el equipo detrás de su tecnología eligió este nombre porque "evoca la idea de un potencial creativo ilimitado".
¿Cómo usar Sora?
Como sucede con otras herramientas de IA, los resultados dependen de los comandos o prompts que cada usuario cree y su capacidad para ingresar descripciones detalladas. Como Sora todavía no se encuentra disponible para el público, desde que se anunció el modelo, la empresa y su fundador y CEO, Sam Altman, han publicado varias demostraciones en X (antes Twitter), utilizando sus propios prompts o respondiendo a peticiones de los usuarios. ¡Anímate a enviar tu propia descripción por X!
El siguiente es uno de esos vídeos, generado por Sora a partir de esta descripción sugerida por una internauta: "Una sesión de cocina con instrucciones para preparar gnocchis caseros a cargo de una abuela influencer y ambientado en una cocina rústica de la Toscana con iluminación cinematográfica."
https://t.co/rmk9zI0oqO pic.twitter.com/WanFKOzdIw
— Sam Altman (@sama) February 15, 2024
Hay que señalar que Sora aún se encuentra en fase de desarrollo y tiene algunas limitaciones que lo hacen generar videos ilógicos, en cuanto a principios de la física o la relación causa y efecto. Por ejemplo, el sistema creó un video en el que alguien estaba comiendo una galleta, pero esta nunca se volvió más pequeña. Por otra parte, la imitación que la herramienta hace de la toma de la cámara puede ser inconsistente de un momento a otro. Sora también parece tener problemas representando las manos humanas y a veces genera espontáneamente nuevos personajes en lugares aleatorios, como si aparecieran por arte de magia. En todos estos detalles están trabajando los desarrolladores.
¿Cuándo estará disponible Sora?
Como lo mencionamos, el modelo de IA sigue en fase de pruebas y, por el momento, solo tiene acceso a este un grupo selecto de investigadores de OpenAI. La empresa también afirmó que está colaborando con expertos para evaluar el potencial de Sora en materia de desinformación, contenido ofensivo y la falta de imparcialidad. OpenAI no ha anunciado ninguna fecha oficial para su lanzamiento, pero todo indica que se integrará a su oferta de productos una vez tomen las medidas necesarias para garantizar la seguridad de los usuarios.
Aunque muchos han mostrado entusiasmo por todas las posibilidades que este tipo de tecnología ofrece, otros temen que los deje sin trabajo. Si bien Sora podría agilizar los proyectos de los cineastas experimentados, es cierto que podría sustituir por completo a los artistas digitales con menos experiencia.