746
Views

Dall-E 2; MidJourney; Midnight Cafe; Dall-e mini; Disco Diffusion; Stable Diffusion y esto es solo el comienzo.

AAAAAAAAAAAAAAAAAh. creían que no iba a escribir más, ¿no?
¿Creíste que iba a volver con el coso de los Shitpostings? si, bueno, me encantaría, pero no todo en la vida es como me gusta, por algo no existe el día Osvaldo.

¿En qué estábamos? Ah, si, se está yendo todo al chori ¿recuerdan hace un tiempo el texto fumón de Conoces a Dall-E?, bueno…

 

imagen 1

 

Esta nota se tardó muchísimo en arrancar por muchas razones, la principal siendo: todo está yendo muy rápido, hay novedades todos los días y cada vez que decis algo, cambia, así que, hablando con el staff se sugirió el siguiente hilo:

  • Famoso Youtuber hizo video explicando la onda de las IA´s generadoras de imágenes y cómo funcionan: el tema ya está super accesible y se instala de forma masiva.
  • En cuestión de días ya hay bocha de material en video, texto y toda la bola. Así que taladrarte con lo mismo sería una chorrada…

¡Pero de esto vamos a hablar! porque ya metimos esto en el horno, así que nos lo vamos a tragar

 

Lo que debemos saber para encarar la nota así, a pelo

En abril de 2022 se presentó Dall-E 2, un generador de imágenes a base de texto, o acercándonos a una idea más concreta, desde un prompt: una serie de palabras, órdenes o “impulsos” , que el modelo tomará para crear imágenes a partir de los mismos.

Y pasamos de esto:

 

imagen 2

 

A esto:

 

imagen 3

Dall-E 2 es de OPEN AI (fundada por Elon Musk, Sam Altman, Ilya Sutskever, Greg Brockman, Wojciech Zaremba, John Schulman)

Al poco tiempo, aparece Midjourney, presentándose así:

“Midjourney es un laboratorio de investigación independiente que explora nuevos medios de pensamiento y expande los poderes imaginativos de la especie humana.
Somos un pequeño equipo autofinanciado centrado en el diseño, la infraestructura humana y la IA. Tenemos 11 empleados a tiempo completo y un increíble conjunto de asesores”
.

*Digresión: Esta es la IA que más he probado, la que estoy pagando por cuenta propia. Tuve la suerte de recibir una invitación temprana para su uso hace unos… 3, 4 meses… it´s wild.

 

imagen 4

 

Luego, aprox en Junio, se presenta Stable Diffusion, que es de código abierto, de la mano de stability.ai y patea la puerta, diciendo:

“Stable Diffusion es un modelo de difusión latente de texto a imagen. Gracias a una generosa donación de cómputo de Stability AI y al apoyo de LAION, pudimos entrenar un modelo de difusión latente (latent diffusion model) en imágenes de 512×512 de un subconjunto de la base de datos LAION-5B.
Stable Diffusion es un modelo de texto a imagen que permitirá a miles de millones de personas crear arte impresionante en cuestión de segundos. Es un gran avance en velocidad y calidad, lo que significa que puede ejecutarse en Tarjetas Gráficas accesibles en el mercado”.

 

imagen 5

 

También aparecen otros modelos de texto-a-imagen, pero como no los probé y no los tengo tan calados, por ahora alcanza.

 

¿Pero qué diferencias hay entre uno y otro?

Ok, si no vieron este video, por reglas generales hay que entender que cada red neuronal está programada a su manera particular , se le han otorgado distintos tipos de parámetros a la hora de analizar las millones de bibliotecas de imágenes que la entrenan. Básicamente, depende lo que le des de comer, el Modelo dará un resultado acorde.
Vamos a repasarlas de oído y a grandes rasgos:

 

Dall-E 2

Hay a decirlo, como Dall-E, hasta el dia de hoy, no hay comparación en lo realistas que pueden ser sus resultados. Si le pedimos un rostro , o un personaje famoso (en esto retomaremos en un toque) la devolución probablemente sea muy precisa.

 

Ah, si el cosito:

imagen 6

La marca de agua de Dall-E que está para avisar que es una imagen creada con tal Modelo.

 

Extra: El modelo también posee una característica adicional, la” expansión” de imágenes: al cargar una imagen, podemos solicitar que lo que está fuera de cuadro sea generado. También puede eliminar elementos de una imagen preexistente, teniendo en cuenta luz y sombra; y la posibilidad de tomar una imagen y convertirla a otro estilo pictórico.

 

imagen 7

 

imagen 8

 

Aunque no todo lo que es oro brilla, la gente de OPEN AI no comenzó tan Open (abierto en inglés): para usarlo, tenes que entrar a una lista de espera. Y sale sus buenos billetes.

“Ojalá Dall-e tuviera una opción ilimitada. Acabo de quemar $ 40 con impuestos incluidos en un día (200 imágenes). Los $ 15 por 100 imágenes en realidad me cuestan $ 20 con impuestos (Suecia). Dalle 2 es impresionante, sin embargo[…]”. Posteo de Reddit de /ButterscotchFalse310

 

Midjourney

El tiempo se devoró mi texto: Luego de la última actualización el modelo ha logrado dar un salto y aunque cerca de lograr los rostros y anatómicas precisas, Dall-E sigue teniendo la posta en ese aspecto.

PERO, la potencia de Midjourney reside justamente en esta diferencia: su red neuronal está tuneada para dirigirse hacia un sentido más “artistico”, por así llamarle; sus resultados “a medio camino” (eso significa Midjourney) evocan a una especie de surrealismo de ensueño.

Lo mismo que el caso anterior, hay que solicitar acceso, donde deberemos aportar datos personales y nuestras intenciones (si son artisticas mejor) de nuestro uso del modelo; además de valer sus buenos billetes, pudiendo acceder a una membresía básica de 10 dolares (uso limitado a 200 min) y una standard de 30 (ilimitada). El lado amable: se puede acceder a 25 min gratis por usuario, además una vez abonado, podes usar el bot en tu propio canal de Discord.

 

imagen 9

 

Stable Diffusion

 

imagen 10

 

De la triada, la joven promesa, el hereje, el Jester: Stable diffusion crece junto con sus usuarios y se perfila como la opción que puede cambiar el juego, la caja de Pandora que hay que proteger a toda costa.

A estas alturas, nada tiene que envidiarle a sus competidores, la precisión es altísima, y sus capacidades impensables.

 

Imagen 11
Así es, ahora el modelo está preparado para usar tu placa, en tus tiempos, la limitación es económica, obviamente, pero más directa.

Y con la siguiente galería, tenemos un hermoso segway:

¿Lo notaron?

El reino de los pechos, la sangre, la violencia, los famosos y la genitalia

 

Como me parece un subtema, decidí tratarlo aparte: Stable Diffusion no tiene censura. A diferencia de Dall-E, que tiene un censor enorme con la desnudez, la violencia y personas famosas; de Midjourney, que no tiene tanto drama con la farándula pero no se banca que le pidas algo de sangre o poca ropa (medio como si fuera clase media pacata de los de los 90); SD no refunfuña ante la moral, es abierto, y vio películas de I-Sat (canal de TV de culto argentino de los 2000 que pasaba desde animé hasta soft porn en su horario nocturno).

Ahora, sobre Midjourney, en una entrevista a uno de sus creadores, David Holz, se refería así sobre las políticas de uso de la app:

Los Términos de Servicio de Midjourney establecen: “Nada de contenido para adultos o gore. Por favor, evite hacer contenido visualmente impactante o perturbador. Bloquearemos algunas entradas de texto automáticamente”.

De las palabras de Holz:

“Creo que si viviéramos en un mundo que no tuviera redes sociales, entonces no necesitaríamos tener ninguna restricción… Cuando se inventó Photoshop, en realidad había prensa al respecto, donde era como, ‘oh, podrías trucar cualquier cosa y es un poco aterrador’. [Pero ahora], es mucho más lucrativo ser sensacionalista de lo que era antes”.

“Hoy en día, cualquiera puede ser sensacionalista, y básicamente beneficiarse de eso. Y entonces, lo que hace es crear un mercado para el drama y el sensacionalismo. Es por eso que creo que tenemos que ser un poco más cuidadosos, porque en algún momento, lo que la gente hará es decir: ‘Está bien, puedo hacer fotos de esto, ¿cuáles son las cosas más dramáticas, ofensivas y horribles que puedo hacer?'”.

“Desafortunadamente, no hay una manera clara de abordarlo, excepto como sociedad, para recompensar menos el sensacionalismo. Sin embargo, mi impresión es que nadie realmente está tratando de cambiar las plataformas sociales para reducir el sensacionalismo, porque eso les hace ganar dinero en este momento”.

“Realmente no queremos tener espacios segmentados para las personas a las que les gusta hacer cadáveres o fotos de desnudos”, explicó Holz. “Simplemente no queremos tener que lidiar con eso. No creemos que tengamos la obligación moral de hacer eso en esta etapa. Queremos un hermoso espacio social para que las personas hagan cosas juntas y no se ofendan, básicamente, y se sientan seguras”.

Sobre Stable Diffusion sólo encontré este posteo acerca de alguien quejándose que sus imágenes salían nubladas en su sesión de Discord:

 

Imagen 12

Al parecer, esto es un tema de Discord y ya no sucede.

Mientras en las mini redes se discute y se pelea al respecto de “no queremos material tóxico en nuestras imágenes/feeds” versus “tengo todo el derecho de ponerle tetas a una versión furry de Ghandi”, lo que nos recuerda las exclamaciones de ciertos sectores al querer prohibir la posibilidad de imprimir un arma con tu impresora 3D.

 

Sobre lo que puede que venga y la futurología de esto:

Desde Contemplando el Éter sabemos que les gusta algo de futurología, así que venga el chisme:

“Estimados compañeros artistas y diseñadores.
Es el año 2022. Estamos ante el umbral de una nueva era tecnológica en el mundo de la creatividad. Muy pronto, habrá un movimiento #BoycottAI.

Muchos artistas y colectivos / sindicatos de artistas comenzarán un boicot masivo de los bienes producidos por IA y hacia los creativos que usan IA en su trabajo. Los empleadores despreciarán a un candidato potencial para un trabajo, por la duda de que él / ella utilice la IA para ayudar a crear su portfolio.

Habrá un resurgimiento de los llamados “Creativos Orgánicos”, tradicionalistas que rechazan toda la tecnología de IA y prefieren crear todo de la manera “tradicional, no IA”. Artistas, escritores, músicos y diseñadores agregarán “Artista / Diseñador humano orgánico, no IA” en su biografía de IG y eslogan de CV. Las galerías de arte y las comunidades en línea desarrollarán moderadores / aplicaciones / expertos para detectar el arte y el contenido creados por IA, y ponerlos en la lista negra del mercado.

Los chefs boicotearán las recetas y restoranes creadas por IAs,los músicos boicotearán la música creada por IA, donde podrías crear una canción completamente sintética con la capacidad de reemplazar voces femeninas con voces masculinas.

¡Al demonio! ¡Incluso podrías reemplazar la voz de cualquier cantante con la tuya!

O hacer que Frank Sinatra cante una canción de Adele.

Los médicos e ingenieros se rebelarán contra los robots y aplicaciones de IA que realizen cirugías, escriban recetas y dirijan proyectos de construcción de puentes.

Escritores, poetas, comediantes e investigadores se declararán en huelga contra wikipedia y youtube cuando consuman mucha tecnología de IA escribiendo trabajos de investigación y haya robots alimentados con toda la historia de la comedia, tomando el control de clubes…

… ¡y conductores y pilotos, contra robots operados por IA que conducen y vuelan sus vehículos! Maestros y profesores en contra de Alexas que aparentan saber todo, enseñando en escuelas y universidades…

Esperen… ¿Estoy escribiendo el guión de un episodio de Black Mirror?

La diversión acaba de empezar chicos… Abróchese el cinturón… La vida se ha vuelto mucho más interesante…”.

Traducción de un posteo de Parijat Devarshy en Midjourney AI (grupo de Facebook).

 

Imagen 13

Otro posteo de una índole un poco más nihilista. Las palabras son de Steven Stahlberg, artista análogo y digital, entre sus trabajos se le reconoce como Leader Artist en Street Fighter V y Final Fantasy XV.

“La Edad de Oro de la ilustración fue aproximadamente de 1880 a 1930, ayudada por los avances en la impresión y la publicación.

En la década de 1800, la invención de la fotografía comenzó a reducir las ganancias de los primeros pintores (era más barato y más rápido obtener una foto familiar), y más tarde el pago de los ilustradores (nuevamente, las fotos eran más baratas, más rápidas y más detalladas).

Hubo un resurgimiento de la ilustración, llámese Edad de Plata, desde 1970 hasta aproximadamente 1995. Esta era la era del artista comercial altamente pagado. Yo era uno de ellos. Vivía en Hong Kong en ese momento, y mi salario neto promedio por mes a principios de los años 90 era de alrededor de 8000 usd.

Luego, a mediados de la década de 1990, llegó la autoedición, y con ella los servicios de fotos de archivo. Básicamente eliminando todo el trabajo de periódicos y revistas, y la mayoría de las portadas de libros, y más tarde también el trabajo publicitario. Y el trabajo que quedaba era muy barato y necesitaba ser terminado en horas, no en días o semanas. Fue un desastre financiero para mí y mi familia.

Luego vino el arte digital. Aproximadamente 2000 hasta hoy.

A finales de los años 90, cuando me adapté y pasé a lo digital, volví financieramente, principalmente porque fui uno de los pocos afortunados que hizo el cambio muy temprano. Luego, todo el resto del mundo del arte lenta y gradualmente hizo el mismo cambio, y mi salario volvió a caer en picada. Yo, como muchos otros tuve que comenzar a utilizar Patreon y servicios similares solo para sobrevivir.

La IA reducirá aún más el mercado, en un momento en que el grupo de artistas talentosos crece más rápido que nunca.

Un día no habrá dinero para ganar como artista. ¿Pero el dinero no es importante, dices? ¿No es la razón por la que hacemos arte? Si piensas eso, o no eres tú quien paga el alquiler, o eres independientemente rico.

Ahora todo el mundo está diciendo, “oh, pero todavía se necesita un humano para ser el creador detrás de la imagen, al igual que con la fotografía”.

Trazan el paralelismo con la fotografía. “¡Es solo una nueva herramienta! ¡Y es tan divertido de usar!” Y otros discuten los derechos de autor.

No están viendo el problema. Pasaron cientos de años desde que Niepce inventó la primera foto permanente, hasta los servicios de fotografía de archivo que mataron la ilustración tradicional.

La IA no tardará cientos de años en madurar. Y tampoco ha madurado ahora. Lo que vemos hoy es un feto. El crecimiento es increíblemente rápido. Dalle-E 2 supera a Midjourney hoy. ¿Quién sabe qué hará mañana? ¿Qué pasa con el próximo año – Dall-E 3?¿ 4? ¿Qué pasa con todas las otras docenas de IA en desarrollo? Mira, la tendencia es clara. La escritura está en la pared. Este es el meteoro que mata a los art-dinos: humanos que trabajan a tiempo completo como artistas profesionales, para mantenerse a sí mismos y a sus familias.

Nunca quise ser otra cosa, nunca podría haber sido otra cosa, soy malo en matemáticas, ciencias y deportes, desde pequeño hasta los 63 años he practicado arte casi todos los días. Eso se acerca a las 100.000 horas. Incluso si tuviera otras 100,000 horas para dedicarlas a otro campo, ¿qué debería elegir? Siempre me gustó la música, pero hay aún menos dinero en eso, y de todos modos la IA llegará para todos los trabajos creativos tarde o temprano. (Y todos los trabajos no creativos también). Tal vez un oficio, siempre disfruté soplado de vidrio… No me arrepiento de presentar el problema tal como lo veo, ya que veo a muy pocas personas mirándolo de esta manera. Creo que es importante identificar los problemas. La única solución que puedo ver es el Ingreso Básico Universal, o IBU, pero aparentemente no podemos hacer eso porque se nos dice que nadie merece sobrevivir a menos que trabajen 8 horas al día haciendo lo que el capitalismo les diga que hagan. Entonces, ¿qué queda, recibidor en Walmart ? No, espera, Walmart eliminó esos empleos en 2019.”

 

imagen 14

 

Ah sí, el temita del copyright…

Uffffff. Si hay un tema que me hizo dar una extrema vagueza para encarar esta nota, es este aspecto. No voy a esconder la mano y decir que el tema del copyright me fascina. No, todo lo contrario, personalmente me embola y me parece producto de este sistema horrible y horrendo. Ya sacandome eso del pecho, vamos:
Desde que alguien dijo “isti is mii y yi li vindi il prici qui quiri” hubo un otre que dijo “yi li pigui, isi qui isti pirficti” (traducción para la gente no estupido-parlante: “esto es mío y yo lo vendo al precio que quiero”/”yo lo pago, asi que está perfecto”) la pelea de quien es cada cosa (y cuanto cobra por ello) se extendió hasta el punto en que:

  • Las grandes compañías y sus abogados estudian cómo se forman las imágenes en éstos modelos, exigiendo que se publiquen también las “fotos originales” que alimentaron los trabajos.
  • Artistas exigen que apps como Midjourney te permitan que tu trabajo sea privado (Midjourney trabaja como Red Social, compartiendo los prompts e imágenes en su página oficial, para que se interactúe entre artistas… y esta opción existe, pero por un dinero.)
  • Grupos de artistas se manifiestan en las redes bregando por el “copyright de los prompts”, alegando que esos conjuntos de palabras deberían registrarse y pasar a formar parte del repertorio privado de cada artista.
  • Dall-E 2, te permite usar sus imágenes, venderlas, usarlas para estampar, lo que sea, la imagen es tuya (aunque tiene su marca de agua); puede usar tu imagen y laburarla como quieran, pues estás usando su servicio.
  • Midjourney te dice “la imagen es tuya para hacer lo que quieras”, pero también te recuerda que todas tus imágenes estan abiertas al público para que las publique, mixee y trabaje como quieran, asi como Midjourney y sus asociados tienen una sub-licencia -sin regalías- de todos los trabajos.
  • Con Stable Diffusion, por su lado, como sale de tu pc, es cosa tuya.
  • Artistas exigen regalías por usar sus trabajos para alimentar las IA´s.
  • Disney está viendo como meterle copyright a los productos creados por estos métodos.
  • Tal vez lo más importante y que no leí por muchos lados: ningún servicio te da ninguna seguridad ni protección. Ésto es, el lado bonito de “usala, vemos que onda como va con eso y cuando hagan una moneda, hablamos”; pero también es “en el momento que se arme un quilombo con tu imagen, no te aseguramos que vamos a saltar en tu defensa y capaz nos desligamos completamente”.

Al día de hoy, según entiende este simple mortaloide, así están las cosas.
Ok, hay muchísimo más, pero vamos a cerrar con cosas que encontré a medida iba armando la nota:

¡¡¡MISCELANESAS CON FRITAS!!!

El 26/8/22 Jason M. Allen (Sincarnate en el post) publicaba esto:

 

imagen 15

 

“¡Hola a todos! Después de un paréntesis de un mes, he regresado con un anuncio emocionante sobre mi proyecto personal que he hecho usando Midjourney. He estado explorando un prompt especial que publicaré en una fecha posterior, he creado 100 imágenes usándolo, y después de muchas semanas de ajuste fino y curaduría de mi generaciones, elegí mi top 3 y los imprimí en lienzo después de escalar con Gigapixel A.I. Participé en la competencia de bellas artes de la Feria Estatal de Colorado (categoría de artes digitales). Gané el primer lugar. Aquí están los resultados. Me he propuesto hacer una declaración usando Midjourney de una manera competitiva y ¡guau! No podría estar más emocionado por haber ganado con mi pieza favorita: “Theatre d’Opera Spatial”.

 

Otras alternativas, igual de controvertidas, se han presentado en el ambito del audio:

Vease el servicio “Sintesis Vocal” que clonan voces. En youtube tenemos algunos videos de ejemplo:

Y otro que trajo sus problemas a penas salió, justamente por ser gratis. Acá los usuarios suben vocoids de diferentes personajes y utilizando texto, se puede conseguir un audio de, supongamos, Cartman de South Park diciendo lo que se nos plazca. Tiene sus propias reglas y Discord. Y, según un rumor, las voces de Gokú y Vegueta se dieron de baja por exigencia de los dobladores originales.

Noticia 3/9/22:

Se presenta la posibilidad de integrar Stable Difussion junto con photoshop por medio de un plug-in, está en fase Beta, pero se puede solicitar acceso.

Del Twitter de William Buchwalter (@wbuchw) podemos ver como funciona.

Bueno, y eso es todo por ahora, les quemaría más la cabeza pero me imagino que con esto tenemos por ahora. ¡Hasta la próxima y esperemos que sea pronto, amiguits!

Ø


 

provisorio

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *