DALL-E: qué es, cómo usar, probar, mini online, DALL-E 2...

DALL-E: qué es, cómo usar, probar, mini online, DALL-E 2...

La empresa de inteligencia artificial Open AI ha anunciado el lanzamiento de DALL-E 2, un modelo de inteligencia artificial capaz de generar imágenes a partir de texto. Te contamos todo lo que debes saber al respecto, cómo usar DALL-E Mini para generar imágenes, y qué implicaciones podría tener esta herramienta a futuro.

¿Qué es DALL-E?

Quizás hayas visto en redes sociales, como Twitter, imágenes generadas por inteligencia artificial con una descripción curiosa, por ejemplo, "astronauta montando un unicornio". Esta tendencia no se trata solamente de una moda en redes sociales, sino del lanzamiento de un nuevo algoritmo mejorado para crear imágenes a partir de texto. 

El programa desarrollado por Open AI se conoce como DALL-E, en honor al célebre pintor surrealista, y promete ser la versión más desarrollada hasta el momento de generación de imágenes. La empresa de tecnología financiada por Microsoft, que ha desarrollado previamente algoritmos de generación de texto (GPT-2 y GPT-3), ha combinado esta tecnología, la de Google Imagen y la lectura y creación de imágenes con una base de datos tan extensa que puedes crear prácticamente cualquier cosa que venga a tu imaginación. 

Qué es DALL-E
© Open AI

Según el sitio de Open AI, se trata de "un nuevo sistema de inteligencia artificial, capaz de crear imágenes realistas y arte a partir de una descripción en lenguaje natural". Actualmente es capaz de combinar atributos, conceptos y estilos de artistas famosos (piensa, por ejemplo, en Picasso). Además, el algoritmo comprende nociones de espacio, profundidad, texturas, reflejos y sombra, volviéndolo la herramienta más poderosa a la fecha en su categoría.

¿Cómo funciona DALL-E?

Te preguntarás cómo un software puede hacer todo eso. Para comprender la inteligencia artificial, existen dos procesos principales que se ejecutan en un algoritmo. Primero, está la recopilación de datos para crear una base, que cuanto más extensa sea, mejor. Después está la prueba con imágenes para crear una relación con cada palabra. Mientras se va afinando el algoritmo, existe un proceso de validación de usuarios para que el programa "aprenda" de sus errores (lo que se le conoce como machine learning). Por ejemplo, si alguna vez has tenido que seleccionar semáforos o taxis en una serie de imágenes para verificar que no seas un robot, en realidad has estado participando en la creación y mejora de un algoritmo.

Así, DALL·E 2 ha aprendido la relación entre las imágenes y las palabras usadas para describirlas. El proceso que se utiliza se conoce como difusión, que comienza con un patrón de puntos aleatorios y gradualmente los ajusta cuando reconoce aspectos específicos de una imagen. 

Cómo funciona DALL-E
© Open AI

¿Dónde puedo probar DALL-E Mini?

Aunque el algoritmo de DALL-E 2 se encuentra en una fase restringida, puedes probar una versión anterior de DALL-E online y de manera gratuita, ya que los desarrolladores de Hugging Face han puesto a disposición en su sitio web un modelo con el que puedes interactuar. Solo necesitas ingresar un texto en inglés y hacer clic en el botón para que el algoritmo genere una imagen. Te recomendamos probar varias veces, ya que en los últimos días la página se ha saturado. 

Cómo usar DALL-E Mini
© Hugging Face

En DALL-E Mini podrás experimentar con objetos, estilos pictóricos, lugares, e incluso personajes de televisión, cantantes, políticos y otras celebridades. Aunque podrás ver por ti mismo las limitaciones en la definición de las imágenes, tendrás una excelente idea de cómo funciona esta tecnología y todo lo que podría hacer por nosotros en un futuro: crear arte digital, acelerar el proceso de renderización de planos y diseños, apoyar en sectores como la moda o el diseño de interiores, etc. 

Cómo usar DALL-E Mini
© Hugging Face

¿Cuál es la diferencia entre DALL-E y DALL-E 2?

DALL-E 2 es principalmente una mejora del algoritmo liberado anteriormente bajo el nombre de DALL-E. En su desarrollo se han implementado varias mejoras fundamentales. Además de la capacidad de manejar texturas, sombras y perspectivas, puede editar imágenes existentes de forma realista a partir de una descripción textual. También puede "inspirarse" en una imagen para crear variaciones conservando el mismo estilo. 

¿Está disponible para cualquier usuario?

Actualmente el programa DALL-E 2 solo se encuentra disponible para empleados de Open AI, familiares de empleados, investigadores y un grupo reducido de usuarios. Esto se debe a que todavía se encuentra en una fase experimental, donde se necesita más retroalimentación de los usuarios. Además, aún existen preocupaciones en cuanto a temas de seguridad y buen uso, ya que se busca evitar que un programa tan potente sea utilizado de manera inadecuada. 

Sin embargo, existe la posibilidad de unirse a la lista de espera para utilizar el demo. Solo debes ingresar tus datos en el formulario y especificar si trabajas en el campo de la informática, si haces investigación, si eres periodista o estudiante. Conforme van pasando las pruebas, Open AI elige a más personas que podrán usar esta herramienta, un poco como sucedió en los inicios de Gmail.