Notebookcheck Logo

Cree imágenes AI 30 veces más rápido: Dall-E 3 y Difusión Estable dejados atrás

30 veces más rápido, pero también bueno: DMD. (Imagen: github/tianweiy)
30 veces más rápido, pero también bueno: DMD. (Imagen: github/tianweiy)
Un equipo del MIT ha acortado los procesos de varias etapas de conocidos generadores de imágenes por IA. Esto no sólo reduce el tiempo que se tarda en producir la imagen acabada. También se reducen al mismo ritmo la potencia de cálculo necesaria y el consumo de energía.

La magia de Dall-E o de la difusión estable ya debería resultarle familiar. A partir de una breve descripción de la escena, el contenido y quizá uno o dos comentarios, surge una imagen más o menos realista. Afortunadamente, suele reconocerse como una obra generada por la IA, pero también cumple su función: no tengo que poner un perro en una tabla de surf o un zorro en un traje de astronauta. La imagen deseada está a sólo unos clics de distancia.

En el fondo, sin embargo, es un proceso computacionalmente intensivo que consiste en numerosas iteraciones, repeticiones constantes del algoritmo para llegar finalmente a la imagen deseada. Los investigadores del MIT, sin embargo, han conseguido prescindir de estos numerosos pasos intermedios. En su lugar, la escena descrita se crea después de exactamente un paso.

Esto permite obtener un resultado comparable reduciendo significativamente la potencia de cálculo necesaria o los tiempos de espera. Al mismo tiempo, se requiere menos potencia para accionar el sistema denominado "Destilación de coincidencia de distribución (DMD)".

Dicho de un modo más figurado: las imágenes utilizadas para el entrenamiento se descomponen en zonas más gruesas. Esto determina la composición aproximada de la imagen en función del sujeto. Además, se analiza la probabilidad de varios elementos de la imagen para obtener al final una escena coherente.

En definitiva, la información detallada y la complejidad se reducen, de modo que el generador de imágenes simplemente se vuelve más rápido. En lugar de 2 ó 3 segundos por imagen, el mismo hardware tarda unos 100 milisegundos, una trigésima parte.

Si observa las imágenes de cerca, la reducción de detalles es claramente visible. Los fondos están ligeramente difuminados y los elementos de la imagen pueden repetirse. Aun así, los motivos pueden tener un aspecto significativamente mejor en algunos casos y siguen siendo más fáciles de reconocer como una obra global de inteligencia artificial, o al menos artificial. Otro efecto positivo.

Además del astronauta zorro, puede encontrar muchos otros ejemplos del modelo DMD aquí.

El hecho de que haya menos detalles a la derecha no hace que la imagen sea menos convincente. (Captura de pantalla: tianweiy.github.io)
El hecho de que haya menos detalles a la derecha no hace que la imagen sea menos convincente. (Captura de pantalla: tianweiy.github.io)

Fuente(s)

Please share our article, every link counts!
> Análisis y pruebas de ordenadores portátiles y móviles teléfonos > Noticias > Archivo de noticias > Archivo de noticias 2024 03 > Cree imágenes AI 30 veces más rápido: Dall-E 3 y Difusión Estable dejados atrás
Mario Petzold, 2024-03-25 (Update: 2024-03-25)