IA Genie de Google: qué es, qué hace, qué juegos puede crear
Genie es la nueva IA desarrollada por Google, que permite crear mundos jugables e interactivos fácilmente. Conoce cómo funciona, qué puedes con ella y por qué su tecnología es revolucionaria.
¿Qué es Genie?
Tras el lanzamiento del modelo de IA Gemini, Google ha presentado a Genie (Generative Interactive Environments o Entornos Interactivos Generativos), una demostración de su nuevo modelo de inteligencia artificial generativa. Genie ha sido creado en colaboración con la Universidad de Columbia Británica como parte de la tecnología de IA DeepMind de Google. Su carácter innovador, según Google, es que puede crear juegos y otros productos visuales interactivos a partir de cualquier vídeo, dibujo, boceto, imagen o comando de texto.
¿Cómo funciona Genie?
- Aprendizaje a partir de videos. Para crear un nuevo juego, este modelo de IA sólo tiene que identificar y analizar la dinámica de los vídeos de Internet, ya que aprende de ellos.
- Conversión de videos a datos. Luego, su motor de creación de juegos, al que Google ha llamado modelo de acción latente, convierte los fotogramas individuales de vídeo en tokens, que son como unidades básicas de información que Genie puede entender y manipular y que describen las acciones del juego.
- Genie utiliza los tokens para moldear un nuevo juego mediante la tecnología de diseño dinámico.
- Más allá de lo visible: esta IA no solo analiza las acciones externas observables en los videos (por ejemplo, saltar, correr). También es capaz de identificar y modelar acciones ocultas (como la física de un salto) y partes ocultas en las imágenes (la forma completa de un objeto parcialmente oculto).
- Objetos deformables: Genie incluso puede modelar objetos deformables, lo que significa que puede crear juegos que involucren objetos que se doblan, rompen o cambian de forma durante el juego.
En resumen, Genie puede extraer conocimiento de un número impresionante de vídeos de Internet, cientos de miles, y usarlo para generar nuevos juegos de manera creativa. Sin embargo, para este modelo de IA, basta una imagen, una foto, una descripción textual o incluso un simple boceto para crear una dimensión de juego a partir de ellos. "Esto abre la puerta a una gran variedad de nuevas formas de generar e interactuar con mundos virtuales; por ejemplo, podemos tomar un modelo de generación de texto a imagen de última generación y utilizarlo para producir fotogramas de partida a los que luego podemos dar vida con Genie", afirma Google.
¿Qué juegos puede crear Genie?
Por ahora, Genie puede crear en línea juegos de plataformas 2D de desplazamiento lateral y una sola imagen, al estilo de Super Mario. Sin embargo, Google asegura que pronto el modelo de IA aprenderá a generar mundos en 3D y a dominar la mecánica más fina del movimiento. Según los creadores de DeepMind, los mundos de juego generados son "nítidos y estéticamente agradables".
"Utilizamos un conjunto de datos de unas 200.000 horas de películas de juegos de plataformas en 2D y entrenamos un producto de 11B (11 mil millones de parámetros)... Sin supervisión, Genie aprende acciones latentes variadas que manejan las figuras de un modo fiable", escribió en X Tim Rocktäschel, desarrollador de Google DeepMind.