Portada » bits&bytes » Dall-e vs Stable Diffusion
Dall-e vs Stable Diffusion

Dall-e vs Stable Diffusion

Tras haber leído más de un artículo donde se hablaba a las mil maravillas de la imponente creatividad demostrada por las nuevas inteligencias artificiales para generar imágenes decidí someter a las dos mejores I.A. o A.I. a prueba, cara a cara.

Entrando más al detalle, en este artículo te hablo de Dall-e y Stable Diffusion, unos sistemas mediante los cuales proporcionas un contexto textual para que una inteligencia artificial te genere imágenes en base a esa entrada de texto.

Pues bien y tras haber leído en varios lugares, algunos de ellos especializados, sobre lo impresionante del sistema decidí probarlo a fondo y con ello dar mi opinión. Aunque siempre con una perspectiva diferente, la ya comentada perspectiva de comparación.

Así que vamos a enfrentar una contra otra inteligencia artificial bajo unas mismas intenciones y desafíos a ver cuál de ambas A.I. se desenvuelve mejor, la cerrada y de pago que es Dall-e contra la libre y gratuita que Stable Diffusion.

Sobre Dall-e

El nombre de Dall-e no se a que hace referencia exactamente pero me da a mí que debe ser al genial pintor español Dalí, más que nada por su pronunciación en inglés, donde el maestro del surrealismo exageraba las letras L contra el paladar, típico en los catalanes, para luego hacer una pausa antes de una más que sonora pronunciación de la «i» en la que acaba si nombre. Algo así como «daLLL ÍÍ»

De alguna forma ese surrealismo que tanto nos impresionó en la obra del genial artistas es algo que ahora también nos puede volver a impresionar de la mano de la inteligencia artificial.

El funcionamiento de Dall-e

Formulario de entrada de Dall-e

El sistema comienza mediante la introducción de una frase descriptiva en un formulario. En nuestro día a día siempre tenemos la necesidad de conseguir una imagen para encabezar y así dinamizar gráficamente los artículos que aquí escribimos; en este caso el artículo orbitaba sobre el chateo entre humanos e inteligencias artificiales.

Tras introducir la frase «chat between human and A.I. robot» el sistema nos generó las siguientes propuestas gráficas, fueron un total de 4:

El concepto ha sido comprendido por la I.A. de Dall-e

Realmente en el resultado obtenido, lo que para mí fallaba es que no me gustaba el estilo gráfico aplicado de ninguna de las cuatro propuestas, ya que buscaba un resultado más realístico, sin embargo el concepto es sin lugar a dudas el que andábamos buscando, la I.A, generó una especie de conversación entre un chat y un humano.

De las cuatro, elegí la primera de las imágenes generadas, entonces el sistema te permite pulsar un botón para generar diferentes variaciones del modelo escogido y previamente generado.

Fue entonces cuando nos ofreció alguna imagen de mayor interés, la tercera de las las siguientes variaciones me parece algo más acertada, aunque la imagen aparece cortada con los personajes demasiado hacia los extremos de la imagen.

Las variaciones fueron algo mejor

El sistema de outpainting de Dall-e

Añado sobre mi opinión sobre Dall-e que a posteriori han añadido una funcionalidad para poder hacer retoques sobre la imagen ya generada por su I.A.

Se trata de una novedad más reciente de Dall-e que quizá debería de haber estado desde su puesta en marcha.

Dall-e es de pago

Sin lugar a dudas que algo tan en fase beta sea de pago es la parte que resta más al conjunto pues lo conseguido no ha sido óptimo, o al menos no tan óptimo como par darle una salida profesional e ilustrar los artículos venideros en este medio.

Pero vayamos por paso, quedándonos claro que el sistema de inteligencia artificial de Dall-E es de pago, y está basado en créditos, cabe aclarar que te dan algunos de estos créditos gratis de forma que puedas probar el sistema y a la vez no te puedas exceder en su uso.

Transcurridos unos días de las primeras pruebas y algo hastiado de la lentitud del mismo descubro que me remiten un correo electrónico para ampliar mis créditos, esto es las posibilidades de la prueba.

En resumén, aunque en inglés me dicen:

We’ve added 50 credits to your account as a thank you for being one of the first users to create with Outpainting.

Esto significa que me han añadido la posibilidad de realizar 50 creaciones más por haber sido uno de los primeros usuarios en haber probado el denominado sistema de Outpainting.

No está mal, pero los resultados, siempre desde mi punto de vista, necesidades y pruebas han estado por debajo de los esperado.

Sobre Stable Diffusion

Se trata de un modelo de inteligencia artificial de código abierto y por ende gratuito, a diferencia de Dall-e, con lo que la valoración siempre es algo más relajada.

El funcionamiento de Stable Diffusion

La verdad es que esto de la generación de imágenes mediante inteligencia artificial es una buena idea para el uso aplicaciones de la A.I., hay muchas otras, pera esta desde luego resulta de lo más vistosa, nunca mejor dicho.

Y es que por mi profesión, redactor de artículos casi siempre tecnológicos le veo un gran potencial en la generación de imágenes únicas para ilustrar los artículos que redacto.

Así que la ventaja entre Stable Diffusion y Dall-E comienza en el mismo punto de inicio y tan sólo por el hecho de que Stable Diffusion es gratuita y no me supone un pago.

El formulario de Stable Diffusion

El formulario es algo más avanzado y te permite seleccionar las medidas, es decir el ancho y largo de la imagen que deseas utilizar para tu imagen, algo que Dall-E no permite; de nuevo Stable Diffusion se lleva un punto más en la prueba.

En el primer intento utilicé la misma y exacta frase que había lanzado a Dall-E, «chat between human and A.I. robot» pero Stable Diffusion la reconoció como una NFWS, es decir un contenido no seguro o apropiado para trabajar y debí modificar la frase por un:

«A conversation between human and robot»

Sin embargo tuve que ir haciendo hasta tres modificaciones llegando a incluir «a human person», para que en la imagen me renderizase un ser humano y no dos robots.

WoW! esta imagen generada por Stable Diffusion sí que me gusta

Por si fuera poco el poder realizar estas pruebas desde la web de replicate.com también te dejan utilizar una API para hacer las imágenes a petición de forma programática, algo que los que sabemos de programación siemper agradecemos, incluso te permite descargar el código de un contenedor de Docker para que puedas realizar los cálculos con tu propio ordenador.

Google Stadia vs GeForce Now 2022
Online gaming platforms

Genial lo gratis y bueno de Stable Diffusion.

Me gustó tanto el estilo de los gráficos de Stable Diffusion que finalmente decidí probar ya algunas salidas profesionales del sistema, más que nada generando otras imágenes para otros artículos en los que estaba trabajando.

Le pedí que me hiciese un gráfico bajo el concepto «Google Stadia vs GeForce Now» para otro artículo que estaba escribiendo para tiroriro.com y el resultado fue penoso, me mostró una captura de pantalla o algo parecido con el precio de un videojuego.

En cambio tras repensar mi frase y con ello volver a formula la orden de mi creación digital con algunos cambios esta vez funcionó mucho mejor.

Fue con la frase «online gaming platforms» cuando la API de Stable Difussion mediante la página de dreamstudio me arrojó una foto que sí que era correcta para mi artículo.

Puedes jugar con esta aplicación para generar tus propias imágenes a través de la siguiente dirección online.

Conclusión sobre Dall-e vs Stable Diffusion

Lo gratis gana y por partida doble o triple, estilo, velocidad y precio hacen la I.A, de Stable Diffusion mucho más apetecible que la de Dall-e.