Los sistemas de IA podrían estar a punto de colapsar en un sinsentido, advierten los científicos

Los sistemas de IA podrían estar a punto de colapsar en un sinsentido, advierten los científicos

El "colapso de modelos" podría restar utilidad a sistemas como ChatGPT en un par de años.

Los investigadores advierten de que los sistemas de inteligencia artificial podrían convertirse en un sinsentido a medida que Internet se llene de contenidos creados con este método.

El auge de la inteligencia artificial en la generación de texto, sonido e imagen ha creado una verdadera ola de oportunidades. Para muchos, es una herramienta ideal si se busca crear contenido rápido y a gran escala.

Sin embargo, muchas de las empresas que producen estos modelos utilizan texto extraído de Internet para entrenarlos. Esto puede llevar a un bucle en el que los mismos sistemas de IA que se utilizan para producir ese texto, se entrenen con él.

Esto podría llevar rápidamente a esas herramientas de IA a caer en el galimatías y el sinsentido, según advierten los investigadores en un nuevo artículo publicado en l revista Nature. Esto concuerda con la "teoría del Internet muerto", que sugiere que cada vez más parte de la web se está automatizando en lo que podría ser un círculo vicioso, volviéndolo limitado e irrelevante.

Según el estudio, bastan unos pocos ciclos de generación de contenidos y de aprendizaje de los mismos para que los sistemas produzcan resultados absurdos y repetitivos. En algunos casos se estima que solo toma 9 generaciones antes de llegar a resultados repetitivos e incoherentes.

 

Advierten que el problema "debe tomarse en serio si queremos mantener los beneficios de la formación a partir de datos a gran escala extraídos de la web".

El problema podría solucionarse con una serie de soluciones posibles, como poner marcas de agua en los resultados para que los sistemas automatizados los detecten y los filtren de esos conjuntos de entrenamiento, por tratarse de contenido generado por IA. Por otro lado, es innegable la necesidad de creadores de contenido que sigan alimentando los sets de datos con los que se entrena la IA. Se estima que en solo un par de años las inteligencias artificiales habrán “recorrido” todo el acervo textual presente en el Internet, incluyendo obras literarias.