DALL-E: gratis, DALL-E 3 (ChatGPT, Bing), 2, Mini, español
DALL-E 3, un modelo de inteligencia artificial capaz de generar imágenes a partir de texto, ya está disponible para todos los usuarios. Te contamos todo lo que debes saber al respecto, cómo conseguir créditos, las diferencias con DALL-E 2, cómo usar DALL-E Mini y qué implicaciones podría tener esta herramienta a futuro.
¿Qué es DALL-E?
Quizás hayas visto en redes sociales, como Twitter, imágenes generadas por inteligencia artificial con una descripción curiosa, por ejemplo, "astronauta montando un unicornio". Esta tendencia no se trata solamente de una moda en redes sociales, sino de un algoritmo mejorado para crear imágenes a partir de texto.
El programa desarrollado por Open AI se conoce como DALL-E, en honor al célebre pintor surrealista, y promete ser la versión más desarrollada hasta el momento de generación de imágenes. La empresa de tecnología financiada por Microsoft, que ha desarrollado previamente algoritmos de generación de texto (GPT-2 y GPT-3), ha combinado esta tecnología, la de Google Imágenes y la lectura y creación de imágenes con una base de datos tan extensa que puedes crear prácticamente cualquier cosa que venga a tu imaginación.
Según el sitio de Open AI, se trata de "un nuevo sistema de inteligencia artificial, capaz de crear imágenes realistas y arte a partir de una descripción en lenguaje natural". Actualmente, es capaz de combinar atributos, conceptos y estilos de artistas famosos (piensa, por ejemplo, en Picasso). Además, el algoritmo comprende nociones de espacio, profundidad, texturas, reflejos y sombra, volviéndolo la herramienta más poderosa a la fecha en su categoría.
¿Cómo funciona DALL-E?
Te preguntarás cómo un software puede hacer todo eso. Para comprender la inteligencia artificial, existen dos procesos principales que se ejecutan en un algoritmo. Primero, está la recopilación de datos para crear una base, que cuanto más extensa sea, mejor. Después está la prueba con imágenes para crear una relación con cada palabra. Mientras se va afinando el algoritmo, existe un proceso de validación de usuarios para que el programa "aprenda" de sus errores (lo que se le conoce como machine learning). Por ejemplo, si alguna vez has tenido que seleccionar semáforos o taxis en una serie de imágenes para verificar que no seas un robot, en realidad has estado participando en la creación y mejora de un algoritmo.
Así, DALL-E ha aprendido la relación entre las imágenes y las palabras usadas para describirlas. El proceso que se utiliza se conoce como difusión, que comienza con un patrón de puntos aleatorios y gradualmente los ajusta cuando reconoce aspectos específicos de una imagen.
¿Cuál es la diferencia entre DALL-E 3 y DALL-E 2?
DALL-E 3 es principalmente una mejora del algoritmo liberado anteriormente bajo el nombre de DALL-E 2. En su desarrollo se han implementado varias mejoras fundamentales y se ha extendido la base de imágenes para alimentar el modelo de machine learning. Además de la capacidad de manejar texturas, sombras y perspectivas, puede editar imágenes existentes de forma realista a partir de una descripción textual más compleja que antes. También puede "inspirarse" en una imagen para crear variaciones conservando el mismo estilo.
¿Cómo usar DALL-E 3 con ChatGPT?
La versión más reciente de DALL-E ahora se une con ChatGPT para crear imágenes aún más sofisticadas. Eso significa que a partir de ahora puedes escribir un prompt o comando en ChatGPT para que cree una imagen con características más complejas. A partir del primer resultado puedes continuar haciendo mejoras lanzando nuevas especificaciones en la barra conversacional de esta herramienta. Este salto representa un gran avance para OpenAI con respecto a otros desarrolladores de algoritmos de inteligencia artificial, ya que la riqueza del acervo de ChatGPT es capaz de transmitir comandos más complejos a la herramienta de generación de imágenes DALL-E 3.
Usar estas herramientas combinadas es como si fueras dando indicaciones precisas a un pintor a partir del avance de su obra. Puedes ser tan específico como requieras, pidiendo por ejemplo "una imagen de una rosa comenzando a marchitarse en un florero de cristal, colocado sobre una mesa frente a una ventana, por donde entran los rayos de luz del atardecer". Como comparación, en versiones anteriores de DALL-E, el prompt hubiera tenido que ser más sencillo: una rosa en un florero sobre una mesa, y los resultados quizás no habrían sido tan de tu agrado.
Te preguntarás cómo puedes usar DALL-E 3 con ChatGPT. Pues bien, esta opción está incluida en ChatGPT Plus, el servicio por suscripción de Open AI. Con él tendrás acceso a ChatGPT 4, con tiempos de respuesta más rápidos y acceso prioritario a nuevas funciones. Todo esto tiene un costo de 20 dólares al mes.
¿Cómo usar DALL-E 3 gratis con Bing?
Ahora bien, si buscas una manera gratuita de aprovechar todas las posibilidades de la IA generativa de DALL-E 3, tenemos buenas noticias para ti. Microsoft ha dado un gran paso para posicionar su buscador Bing como uno de los más influyentes en el mercado, y para ello ha implementado la tecnología de OpenAI en su motor de búsqueda. La razón es muy sencilla: es la misma Microsoft quien ha invertido más de US$1.000 millones en OpenAI desde 2019. La implementación de ChatGPT y DALL-E en Bing Chat se irá desplegando en las próximas semanas, con el objetivo de que pronto puedas hacer consultas más rápidas o buscar imágenes tal y como las estabas pensando.
Para usarlo, simplemente deberás entrar a Bing, iniciar sesión con tu cuenta de Microsoft y hacer clic en el icono de Chat en la parte superior de la pantalla. A continuación, podrás teclear la descripción de la imagen que quieres en la barra de texto, incluso poniendo información específica como cierto estilo, gama de colores, etc. En este ejemplo nosotros hemos dado la orden "Crea una imagen de un gato comiendo al estilo de Lucien Freud". En ese sentido, una de las novedades que trae esta integración, es que ahora puedes escribir tus prompts en español, aunque muchas veces las sugerencias de enlaces sigan apareciendo en inglés. Tras unos segundos, verás una respuesta con información adicional y enlaces útiles según el tema, y por último verás las imágenes generadas. Esta herramienta ya está disponible con DALL-E 2, por lo que de inmediato verás una imagen generada con IA, pero una vez que se implemente la nueva versión, los resultados serán aún más impactantes.
¿DALL-E 2 está disponible para cualquier usuario?
Cuando Open AI lanzó DALL-E 2 permitió a todos los usuarios que crearan una cuenta para experimentar con esta herramienta para crear imágenes. Sin embargo, y como era de esperarse, ahora ha pasado a un modelo de pago con el cual requieres comprar créditos para "gastar" creando y descargando imágenes. Sabiendo esto, lo único que hay que hacer para poder usar DALL-E 2 es:
- Acceder a la página de DALL-E de la Open AI.
- Crear una cuenta de usuario de Open AI o abrir sesión con tu usuario y contraseña si ya posees una cuenta.
- Una vez dentro, en la ventana central, verás una barra de búsqueda donde puedes escribir la combinación de palabras (en inglés) que te interese para generar tus imágenes. Después haz clic en el botón Generate.
- Una vez creadas, podrás editar las imágenes, cambiar partes específicas, el estilo de las mismas, etc.
- También puedes simplemente subir una imagen para editarla con DALL-E. Para ello haz clic en la opción upload image to edit, que aparece justo debajo de la barra para generar nuevas imágenes.
- Solo podrás generar imágenes nuevas, si posees DALL-E créditos. A continuación te explicamos cómo funcionan.
¿DALL-E 2 es gratis y cómo conseguir créditos?
DALL-E ofrecía de forma gratuita créditos mensuales renovables a todas las personas que se habían registrado antes del 6 de abril de 2022. Estos créditos se renovaban mensualmente el día en el que el usuario había creado la cuenta y, si no eran utilizados, expiraban con una validez de 30 días. Infelizmente, si estás creando tu cuenta después de esta fecha, ya no podrás recibir créditos mensuales gratis y para poder utilizar DALL-E 2 tendrás que comprar créditos haciendo clic en la opción Buy credits. Justo encima de este botón, aparecerá un número con la cantidad de créditos que tienes disponibles.
- Actualmente, el coste de los créditos para usar DALL-E 2 es de 15 dólares para un paquete de 115 créditos, cada uno de los cuales te permite hacer una consulta que genera 4 imágenes, teniendo un total de 460 archivos por ese precio.
¿Qué es DALL-E Mini y dónde probarlo?
DALL-E Mini es la versión de DALLE-2 simplificada, de código abierto, disponible en GitHub y con una infraestructura menos avanzada que la de su hermano mayor, lo que hace que consuma menos recursos. Si bien es más fácil de utilizar, sus resultados son menos precisos, lo que ha atraído a un público interesado en jugar con esta excentricidad del DALL-E Mini. Para el programador, Boris Dayma, este interés es de suma utilidad porque, aunque los usuarios solo pretendan divertirse, su interacción con el programa ya está alimentando los algoritmos que lo componen. En DALL-E Mini podrás experimentar con objetos, estilos pictóricos, lugares, e incluso personajes de televisión, cantantes, políticos y otras celebridades. Aunque podrás ver por ti mismo las limitaciones en la definición de las imágenes, tendrás una excelente idea de cómo funciona esta tecnología.
Para comenzar a utilizar DALL-E Mini ve a la página web, en la barra central que aparece en blanco escribe en inglés las palabras que desees utilizar para componer tu imagen y haz clic en el botón de Run para visualizar los resultados.