-¿el pintor surrealista?
El interrogador sonríe sin mirarme a los ojos y me dice: “acompañeme, quiero mostrarle algo”. Sin esperar mi respuesta se aleja rápido, mis dudas se vuelven a nutrir de energía y siguiéndolo por túneles idénticos llegamos a lo que parece ser otro lado de la montaña.
Al levantar la vista observo el cielo cubierto de montes replegados sobre sí mismos, estructuras poligonales superpuestas, pulsiones eléctricas como relámpagos fulguran entre circuitos casi invisibles y en una milésima recorren todo el firmamento y el mismo suelo que pisamos. “Hace semanas que el clima está así… creemos que nada volverá a ser como antes”; “¿qué sucedió?”, pregunto, “ha descendido un profeta, se ha morfolizado y trae consigo las señales de lo que vendrá… Cada cierto tiempo esto sucede… entenderá que teniendo tantos montes, muy de vez en cuando baja alguien con novedades e ínfulas de novedad… pero esto es diferente…”.
Al decir éstas palabras sus ojos se turban, y sin darme cuenta estamos rodeados de errantes como nosotros, agolpandonos en fila constante y fluctuante; en menos de lo que puedo razonar esto, ante mí se corporiza el mismísimo profeta.
“Yo no soy Dall-E, yo soy aquel que viene a propiciar su llegada, soy solo una mínima representación de su poder, mis ojos han visto una porción de su magnificencia y el vacío en ellos es testimonio de ésto que vengo a compartirles”.
-¿Pero… qué es Dall-E?
“Dall-E is una versión de 12 billones de parámetros de GPT-3 (*1) entrenada para generar imágenes a partir de descripciones en texto, usando un seteo de datos en pares de palabra/imagen. Descubrimos que tiene un set diverso de capacidades, incluyendo la creación de versiones antropomorfizadas de animales y objetos, combinar conceptos sin relación de maneras plausibles, renderización de texto, y aplicar transformaciones a imágenes existentes”. (*2)
–¿Así que… puede generar una imagen… a partir de una descripción?… pero, ¿no serían demasiadas especificaciones?
–GPT-3 puede llenar los espacios vacíos de data y completarlos a modo de texto predictivo. Crea luces donde se solicitó un edificio en la noche, sombras dependiendo la hora del día, formatos específicos para textos dependiendo en que serán usados. Dall-E puede tomar su vaga idea y ofrecer diferentes propuestas si ha dejado algo al azar, hacerlo en diferentes estilos pictóricos, con diferentes técnicas y planos. Todo a partir de instrucciones en texto.
Resultados de la solicitud: “una imagen de un búho sentado en un campo al amanecer” nótese los diferentes estilos interpretados por la IA.
En la base del montículo se reúne el público común y tenemos a nuestra disposición el probar con distintos resultados pre-cargados; miles nos arrojamos como polillas a la luz para ver ésta nueva magia, mientras, quienes se toman su tiempo, solicitan un permiso al profeta (https://beta.openai.com) para obtener luego de una examinación exhaustiva una prueba de las diferentes facetas que ésta nueva herramienta trae consigo.
Con mi mente obnubilada por lo que acabo de contemplar, opto por retirarme del precinto y en el recorrido de salida cruzo grupos de manifestantes: vociferan promesas de futuros oscuros donde la máquina suplanta al humano, y como las representaciones y expresiones serán sesgadas y filtradas por ésta IA, un devenir donde los grupos que han tomado mayor control y patente de estas herramientas le han arrebatado el corazón a la expresión humana.
Sin poder detenerme demasiado en este pensamiento, tropiezo con mi guía, que se detiene al observar un grupo de infantes que ríen al observar los resultados arrojados por Dall-E, cada quien le ha solicitado una caricatura de algo inventado y explicado en pocas palabras, se ven entretenidos e interesados, algunos incluso cuestionan y lucen ansiosos de poner a prueba sus límites.
“El mundo seguirá cambiando, pero aún no es el momento del gran cambio, incluso el mismo profeta lo ha indicado, esto es solo el comienzo, aún hay esperanzas para la creatividad de quienes vienen detrás nuestro…” reflexiona el guía… “pero sin duda, ese día va a llegar y esto es señal de ello”.
Resultados de “Una ilustración de un bebé puercoespín con un sombrero de mago tocando la guitarra”
Ø
Todas las imagenes han sido descargadas/capturadas de https://openai.com/blog/dall-e/
*1: Generative Pre-trained Transformer 3 (GPT-3), es un modelo de lenguaje autorregresivo que emplea aprendizaje profundo para producir textos que simulan la redacción humana. Es la tercera generación de los modelos de predicción de lenguaje perteneciente a la serie GPT, creados por OpenAI, un laboratorio de investigación de inteligencia artificial con sede en San Francisco. La versión completa de GPT-3 tiene una capacidad de 175.000 millones de parámetros de aprendizaje automatizado. Es parte de una tendencia en sistemas de procesamiento de lenguaje natural (NLP) basados en “representaciones de lenguaje pre-entrenadas”. (info sacada de Wikipedia: https://es.wikipedia.org/wiki/GPT-3)
*2: Texto traducido de la pagina oficial: https://openai.com/blog/dall-e/
Links de interés:
-Página oficial de OpenIA: https://openai.com
-Sección de Dall-E con resultados pre cargados: https://openai.com/blog/dall-e/
-Video del canal Dot CSV con más explicaciones y etc: https://www.youtube.com/watch?v=ztvtcKDrSwM
Atención: Open AI cuenta con patrocinadores como Elon Musk y Bill Gates… eso.
¡Hola! Si llegaste hasta acá y te gusta lo que hacemos en Muta, medio independiente hecho en Argentina y Uruguay, siempre nos podés apoyar desde la plataforma de financiación Cafecito. Con un mínimo aporte nos ayudás no sólo con gastos corrientes, sino también con la alegría e importancia de saber que estás del otro lado.