Notebookcheck Logo
Imagen generada por IA de un hombre con una chaqueta ciberpunk iluminada con neón sentado en un sofá de un elegante club. Detrás de él se lee "GENERE IMÁGENES EN SU PC GRATIS" (Fuente de la imagen: AI Generated)

Guía: Así se generan imágenes en su PC de forma gratuita

CheckMag

¿Desea generar imágenes en su PC sin depender de los servicios en la nube? Esta guía le guiará a través de la configuración de herramientas gratuitas y de código abierto para un control creativo total sin suscripciones.
Rohith Bhaskar, Rohith Bhaskar (traducido por Ninh Duy) Publicado 🇺🇸 🇫🇷 ...
AI GPU Nvidia Open Source

Las herramientas de generación de imágenes son cada vez más capaces de crear imágenes fotorrealistas de última generación. Por desgracia, la mayoría de ellas están bloqueadas en línea tras un muro de pago, pero ¿y si le dijera que hay una forma de ejecutarlas localmente con mucha más flexibilidad que la que ofrecen las herramientas en línea?

Requisitos previos

1) Una tarjeta gráfica Nvidia con un mínimo de 8 GB de VRAM. (Se recomienda RTX 3060 o superior )

2) Un mínimo de 16GB de memoria de sistema DDR4. (Cuanta más tenga, mejor )

3) Windows 10/11 (sistema operativo de 64 bits necesario )

4) Un mínimo de 100-150 GB de espacio libre en el disco duro para configurarlo todo y descargar los modelos.

5) Una conexión a Internet para la configuración inicial. (Necesaria sólo para descargar e instalar frontends de interfaz de usuario y modelos de imagen )

Nota: Las GPU de AMD o Intel no son compatibles oficialmente con la mayoría de los frontends de interfaz de usuario y requieren soluciones alternativas para funcionar.

Lo primero que debe hacer es asegurarse de que está ejecutando los últimos controladores de estudio de Nvidia para su tarjeta gráfica. Si no está seguro de la GPU Nvidia que tiene instalada, haga clic con el botón derecho del ratón en cualquier lugar del escritorio y haga clic en "Panel de control NVIDIA" en el menú contextual.

Una pantalla del menú contextual del botón derecho del ratón en Windows 11, destacando el Panel de control de Nvidia. (Fuente de la imagen: Captura de pantalla de Windows)
Haga clic en Panel de control de Nvidia en el menú contextual. (Fuente de la imagen: Captura de pantalla de Windows)

Ahora, busque "Información del sistema" en la parte inferior de la página que se abre. Debería ver el nombre de su tarjeta gráfica a la izquierda, junto con más información si fuera necesario.

Una captura de pantalla del Panel de control de Nvidia en Windows 11 con un resalte rojo en Información del sistema en la parte inferior. (Fuente de la imagen: Captura de pantalla de Windows)
Busque Información del sistema en la parte inferior. (Fuente de la imagen: Captura de pantalla de Windows)
Captura de pantalla de la pestaña GPU de Nvidia dentro de la sección Información del sistema en el Panel de control de Nvidia en Windows 11. (Fuente de la imagen: Captura de pantalla de Windows)
Busque el nombre de su GPU a la izquierda. (Fuente de la imagen: Captura de pantalla de Windows)

Abra el repositorio oficial de controladores de Nvidia aquí, busque Controladores Nvidia Studio y haga clic en Descargar. Esto abrirá una página para que descargue el controlador más reciente. Ahora, vale la pena comprobar si su producto Nvidia es compatible con el controlador. Puede hacerlo haciendo clic en "Productos compatibles", justo debajo del botón de descarga. Instale los controladores y reinicie su PC.

Nota: Esto sobrescribirá los controladores Game Ready si los tiene instalados. Si su sistema es principalmente para juegos, puede que vea reducido su rendimiento en los juegos.

Estupendo El primer paso ya está completo. Ahora, podemos pasar a las cosas divertidas, como la descarga de frontends de interfaz de usuario. Recomiendo encarecidamente descargar e instalar Stability Matrix. Es una herramienta de mantenimiento todo en uno que soporta múltiples frontends de interfaz de usuario y los mantiene actualizados automáticamente. Incluso crea carpetas compartidas para modelos y salidas que puede ver en un solo lugar.

En la página GitHub de https://github.com/LykosAI/StabilityMatrix?tab=readme-ov-file#%EF%B8%8F-one-click-install-and-update-for-stable-diffusion-web-ui-packagesdesplácese hasta la sección readme y busque su sistema operativo. Stability Matrix también ofrece descargas para Linux y Mac. A efectos de esta guía, utilizaremos la versión para Windows.

Captura de pantalla de la página GitHub de Stability Matrix con el botón de descarga de Windows 10/11 resaltado. (Fuente de la imagen: Captura de pantalla de Windows)
Haga clic en el botón de Windows 10/11 para descargar Stability Matrix. (Fuente de la imagen: Captura de pantalla de Windows)

Haga clic en el botón del sistema operativo, y debería pedirle que descargue un archivo .zip. Deberá colocarlo en la unidad en la que desee instalar Stability Matrix. Asegúrese de que dispone de al menos 100-150 GB de espacio libre en la unidad. Esto no es sólo para instalar Stability Matrix, sino también para descargar los modelos necesarios, los codificadores de texto y otros archivos del sistema. Estos se suman muy rápidamente.

Una vez que haya descargado el archivo, descomprímalo y ejecute el archivo StabilityMatrix.exe que se encuentra dentro de la carpeta extraída. Debería descargar automáticamente todos los archivos necesarios y configurar la interfaz por usted.

¡Fantástico! Ahora tenemos una interfaz para descargar e instalar múltiples interfaces de usuario.

Ahora, es el momento de decidir el front-end que desea utilizar. Un frontend es una interfaz gráfica de usuario (GUI) que le permite interactuar con los modelos de imagen, manipular los ajustes y, lo que es más importante, generar imágenes.

Busque el botón "Añadir paquete" en la parte inferior y haga clic en él para que aparezcan las distintas opciones.

Captura de pantalla de la interfaz de la Matriz de Estabilidad en Windows 11, con el botón de paquetes resaltado en rojo. (Fuente de la imagen: Captura de pantalla de Windows)
Haga clic en el icono Paquetes situado a la izquierda. (Fuente de la imagen: Captura de pantalla de Windows)
Captura de pantalla de la interfaz de la Matriz de Estabilidad en Windows 11, con el botón Añadir paquete resaltado en rojo. (Fuente de la imagen: Captura de pantalla de Windows)
Haga clic en Añadir paquete en la parte inferior. (Fuente de la imagen: Captura de pantalla de Windows)

He aquí una lista rápida de las opciones que ofrece la Matriz de Estabilidad.

1) Difusión estable Forja WebUI

2) Difusión estable WebUI Forge - Clásica

3) ComfyUI (Recomendado)

4) Foooocus

5) Fooocus - Edición 1-Up de mashb1t

6) Difusión estable WebUI

7) SwarmUI

8) Cogstudio

9) Difusión estable WebUI UX

10) RuinedFooocus

11) SD.Next

12) SDFX

13) InvokeAI

Personalmente, recomendaría encarecidamente el uso de ComfyUI. Es una aplicación visual basada en nodos que puede parecer un poco intimidante al principio, pero es sorprendentemente fácil acostumbrarse a ella. Recuerde que Stability Matrix puede gestionar múltiples frontends, por lo que no tiene por qué limitarse a uno solo. Puede experimentar y encontrar la que más le convenga.

Utilice la lista anterior y navegue hasta las páginas de GitHub de cada paquete. Tómese su tiempo y aprenda más sobre cada paquete antes de hacer una elección.

Para los propósitos de esta guía, le guiaré a través de la descarga e instalación de ComfyUI, junto con algunas extensiones útiles que deberían servirle bien.

Instalación y configuración de ComfyUI

Abra Stability Matrix y haga clic en el botón "Añadir paquete". Ahora encuentre "ComfyUI" en la lista de paquetes ofrecidos y haga clic en él. En la página que se abre, asegúrese de que "master" está seleccionado en el cuadro desplegable. La versión "master" es la más estable y la recomendada para la mayoría de los usuarios.

Una captura de pantalla del hub de ComfyUI para la instalación en la Matriz de Estabilidad, con un resaltado rojo en el menú desplegable de selección de compilación. (Fuente de la imagen: Captura de pantalla de Windows)
Asegúrese de que maestro está seleccionado en el menú desplegable. (Fuente de la imagen: Captura de pantalla de Windows)

Una vez que haga clic en Instalar, Stability Matrix comenzará a descargar el paquete por usted. Espere a que termine. Puede tardar unos minutos en descargarse, así que no dude en seguir utilizando su sistema mientras tanto. Si el cuadro de descarga se cierra o si pulsa accidentalmente "Ocultar", utilice el botón de descargas de la parte inferior para ver el estado de su descarga actual.

Captura de pantalla de la interfaz de la Matriz de Estabilidad con el botón de descargas resaltado en rojo. (Fuente de la imagen: Captura de pantalla de Windows)
Puede comprobar las descargas en curso pulsando este botón. (Fuente de la imagen: Captura de pantalla de Windows)

Una vez instalado, debería ver una notificación emergente sobre su bandeja de sistema informándole de que ComfyUI está listo para su uso.

Vuelva a Paquetes, y verá el mosaico de ComfyUI en la página, pero no lo inicie todavía. ComfyUI está configurado para lanzarse en modo VRAM Normal para GPUs con 12GB VRAM o superior por defecto. Si tienes una tarjeta de 8GB VRAM, ahora es un buen momento para forzar el lanzamiento de Comfy en modo VRAM Baja.

Una captura de pantalla del centro de paquetes de Stability Matrix con los ajustes resaltados en rojo en el mosaico de ComfyUI. (Fuente de la imagen: Captura de pantalla de Windows)
Haga clic en el icono de configuración. (Fuente de la imagen: Captura de pantalla de Windows)

Haga clic en el engranaje de configuración del centro y desplácese hacia abajo hasta encontrar la sección VRAM. Seleccione "--lowvram" y pulse Guardar.

Una captura de pantalla del menú de ajustes dentro de la baldosa ComfyUI en la Matriz de Estabilidad con la vram baja resaltada. (Fuente de la imagen: Captura de pantalla de Windows)
Seleccione "--lowvram" y pulse Guardar. (Fuente de la imagen: Captura de pantalla de Windows)

A continuación, tenemos que instalar el ComfyUI Manager. Es un componente crítico que le permite instalar y gestionar varios nodos personalizados dentro de la aplicación. Haga clic en el icono Jigsaw de la derecha y escriba "ComfyUI-Manager" en la sección "Extensiones disponibles". Selecciónela y haga clic en Instalar en la parte inferior. Una vez que haya terminado de instalarse, debería ver "(instalado)" junto a él. Ahora, ya estamos listos para iniciar ComfyUI.

Una captura de pantalla destacando el icono del rompecabezas en el azulejo ComfyUI en la Matriz de Estabilidad. (Fuente de la imagen: Captura de pantalla de Windows)
Haga clic en el icono del rompecabezas para abrir el menú de extensiones. (Fuente de la imagen: Captura de pantalla de Windows)
Una captura de pantalla del menú de Extensiones Disponibles para ComfyUI en la Matriz de Estabilidad. (Fuente de la imagen: Captura de pantalla de Windows)
Seleccione ComfyUI-Manager y pulse Instalar. (Fuente de la imagen: Captura de pantalla de Windows)

Inicie ComfyUI y deje que se ejecute a través del proceso de arranque. Una vez hecho, se abrirá automáticamente en una nueva pestaña de su navegador por defecto. Si no lo hace, vuelva a la pestaña Paquetes y haga clic en WebUI en el azulejo ComfyUI ahora de color verde.

Una captura de pantalla de la baldosa verde ComfyUI en la Matriz de Estabilidad con la opción WebUI resaltada en rojo. (Fuente de la imagen: Captura de pantalla de Windows)
Haga clic en el botón WebUI para abrir la interfaz de ComfyUI en su navegador por defecto. (Fuente de la imagen: Captura de pantalla de Windows)

Enhorabuena Ya ha terminado con todos los requisitos previos. Ahora, pasemos a lo bueno, descargar y utilizar modelos de imagen.

Descarga y utilización de su primer modelo de imagen

Antes de empezar a descargar modelos de imagen, repasemos un glosario de términos con los que debería estar familiarizado.

1) UNET/Punto de control/Modelo de difusión/Difusores - El gran jefe. El cerebro de la operación, piense en él como el artista que pinta utilizando sus palabras.

2) Tokenizador - El cronometrador. Convierten sus indicaciones en tokens para incrustarlos antes de que los codificadores de texto tomen el relevo. Dependiendo del modelo, estará limitado a un número determinado de tokens (palabras) que puede utilizar.

3) Codificadores de texto/CLIP - Los pesos pesados. Convierten sus indicaciones de texto en entradas digitales que el UNET puede entender.

4) Muestreadores - El conductor maestro. Guían iterativamente el proceso de generación de imágenes, refinándolas desde el ruido hasta la salida final.

5) VAE - El equipo de limpieza. Limpian el ruido tras la fase de generación y ayudan a mejorar la calidad de la imagen.

Ahora, se encontrará con más términos en su viaje, pero estos son los básicos que definirán todo a partir de este punto. No se preocupe demasiado por entrar en detalles sobre ellos todavía.

Una captura de pantalla del menú Flujo de trabajo en ComfyUI con Examinar plantillas resaltado. (Fuente de la imagen: Captura de pantalla de Windows)
Seleccione la opción Examinar plantillas. (Fuente de la imagen: Captura de pantalla de Windows)

Inicie ComfyUI y debería abrir una ventana de flujo de trabajo limpia para empezar. Haga clic en "Flujo de trabajo" en la parte superior izquierda y luego en "Examinar plantillas"

Captura de pantalla del centro de flujo de trabajo en ComfyUI con las opciones Básicas y Generación de imágenes resaltadas. (Fuente de la imagen: Captura de pantalla de Windows)
Haga clic en Conceptos básicos y, a continuación, en Generación de imágenes. (Fuente de la imagen: Captura de pantalla de Windows)

Se abrirá una ventana con flujos de trabajo de ejemplo ya configurados para usted. Haga clic en "Conceptos básicos" y luego en "Generación de imágenes" Inmediatamente verá un error en la pantalla informándole de que faltan modelos. Esto se debe a que aún no hemos descargado un modelo de imagen. Sigamos adelante y hagámoslo. Haga clic en descargar.

Captura de pantalla de un menú de error en ComfyUI con el botón Descargar resaltado. (Fuente de la imagen: Captura de pantalla de Windows)
Descargue el Checkpoint que falta. (Fuente de la imagen: Captura de pantalla de Windows)

Mientras se descarga el archivo, detengámonos en algunas diferencias entre los distintos modelos que verá. Lo que estamos descargando ahora mismo es el Stable Diffusion 1.5 modelo base. En el lienzo de ComfyUI, habrá notado tres conexiones separadas desde el primer nodo "Load Checkpoint". Una para MODEL, CLIP y VAE.

Un primer plano del nodo Punto de control de carga en ComfyUI. (Fuente de la imagen: Captura de pantalla de Windows)
Las tres salidas del punto de control de carga están conectadas a un nodo del flujo de trabajo. (Fuente de la imagen: Captura de pantalla de Windows)

Esto se debe a que los tres están incluidos en este punto de control base, y no necesita utilizar CLIPs y VAE por separado para este modelo en particular.

Los modelos de imagen más recientes, sin embargo, como Flux o HiDreamrequieren que los descargue por separado, así que téngalo en cuenta. Afortunadamente, disponen de plantillas de ejemplo como ésta, por lo que no tendrá que preocuparse de configurarlo todo. Hablaremos de eso más adelante. Por ahora, vamos a generar nuestra primera imagen.

Ahora, si hace clic en el botón Ejecutar en la parte inferior derecha, se dará cuenta de que ComfyUI todavía le da un error. Eso es porque el modelo necesita ser colocado en la carpeta correcta para que Comfy lo reconozca. Ahora, vaya a la carpeta donde descargó el modelo en el Explorador de archivos y cópielo.

Observará que el nombre del archivo tiene una extensión ".SAFETENSORS,". Este es el formato que utiliza el archivo. Como regla general, sólo descargue archivos con la extensión .safetensors. No descargue tensores pickle o .pth. Confíe en mí¡!

Abra la carpeta donde instaló Stability Matrix, y busque una carpeta llamada "Models" Haga doble clic en ella, y busque una subcarpeta llamada "StableDiffusion", pegue el archivo .safetensors dentro de ella.

Para futuras referencias. Los modelos con CLIPS y VAE incluidos deben colocarse en la carpeta "StableDiffusion". Los modelos con sólo el UNET (sin CLIP ni VAE) se colocarán en la carpeta "DiffusionModels". Los codificadores de texto (T5, Llama, CLIP L, CLIP G) deben colocarse en la carpeta "TextEncoders". Por último, sus archivos VAE se colocan en la carpeta "VAE".

Como probablemente pueda ver, hay muchas más carpetas que sólo esas tres. Mi consejo es que lo resuelva cuando llegue a ellas. Por ahora, preocupémonos de nuestra imagen.

Un primer plano del menú desplegable del punto de control de carga en ComfyUI. (Fuente de la imagen: Captura de pantalla de Windows)
Seleccione "v1-5-pruned-emaonly-fp16" en el menú desplegable. (Fuente de la imagen: Captura de pantalla de Windows)

Actualice la página web de ComfyUI en su navegador. Haga clic en el cuadro de diálogo del nodo "Cargar punto de control" y seleccione su archivo descargado.

Dado que se trata de una plantilla, todo está ya configurado para usted. Sin embargo, merece la pena conocer los fundamentos básicos para sus futuros flujos de trabajo. Empecemos por la izquierda. Ya hemos hablado del nodo "Punto de control de carga", y junto a él hay dos nodos "CLIP Text Encode (Prompt)".

El de arriba es el de las indicaciones positivas o lo que se quiere ver en la imagen. El de abajo es la entrada para las indicaciones negativas o lo que no quiere ver en la salida final. Generar imágenes es el equilibrio de estos dos nodos combinados. Usted crea una imagen, marca lo que no le gusta de ella e introduce eso en la indicación negativa. Por ahora, estos ya están introducidos para nosotros, así que hagamos clic en "Ejecutar"

ComfyUI es una interfaz visual, lo que significa que realmente puede ver el proceso sucediendo nodo por nodo. Una vez que su texto está codificado, se envía al "KSampler", que comienza a iterar la imagen. Repasemos rápidamente todos los ajustes de este nodo.

1) Semilla: Piense en ella como la dirección de la imagen. Misma indicación positiva + indicación negativa + mismos ajustes + misma semilla = la misma imagen. Útil para recrear e iterar sobre una imagen.

2) Control tras la generación: Determina si la semilla se aleatorizará después de cada generación o si debe permanecer fija.

3) Pasos: El número de pasos que debe iterar el KSampler. La mayoría de los modelos vienen con pasos recomendados.

4) CFG: La capacidad de respuesta del modelo a sus indicaciones. Valores más altos = cumplimiento estricto de las indicaciones pero menos creatividad. Valores más bajos = resultados más creativos a costa de la adherencia a las indicaciones.

5) Sampler_name: el nombre del muestreador que está utilizando actualmente. Haga clic en el desplegable para ver más opciones. Experimente con diferentes ajustes y muestreadores para obtener salidas variadas.

6) Programador: Piense en él como el segundo al mando que idea estrategias que el director de orquesta aprueba. De nuevo, experimente con diferentes muestreadores y programadores para encontrar el que le funcione.

7) Eliminación de ruido: Determina la cantidad de ruido que se añade al principio del proceso de generación. Éste es eliminado de forma iterativa por el muestreador. El valor no puede fijarse por encima de 1,00, y los valores inferiores (0,45 o 0,65) se utilizan principalmente en los flujos de trabajo de imagen a imagen, refinador o inpainting.

Un primer plano del nodo KSampler en ComfyUI. (Fuente de la imagen: Captura de pantalla de Windows)
La salida "latent_image" del KSampler está conectada al nodo "Empty Latent Image" del flujo de trabajo. (Fuente de la imagen: Captura de pantalla de Windows)
Una captura de pantalla del nodo de Imagen Latente Vacía en ComfyUI. (Fuente de la imagen: Captura de pantalla de Windows)
La imagen latente vacía determina el tamaño del resultado final. (Fuente de la imagen: Captura de pantalla de Windows)

La entrada latent_image situada a la izquierda del nodo KSampler determina el tamaño de la imagen. En el flujo de trabajo, está conectada a un nodo "Imagen latente vacía" con una resolución de 512x512 y un tamaño de lote (el número de imágenes generadas en una ejecución) de 1.

Un ejemplo de imagen de salida de una botella generada por IA con una galaxia en su interior guardada sobre una mesa de madera lisa. (Fuente de la imagen: AI Generated)
Nuestra primera imagen utilizando los ajustes de generación. (Fuente de la imagen: AI Generated)

Ahora, ¡mire esto! Nuestra primera imagen. Si ha llegado hasta aquí, ¡enhorabuena! Ahora conoce lo más básico para empezar su viaje en la generación de imágenes. Cuanto más experimente, más descubrirá, y esta madriguera de conejos es muy profunda. Así que diviértase.

Enlaces útiles

CivitAI: Su ventanilla única para descargar modelos, LoRAs, incrustaciones y mucho más. (Precaución: incluye contenido NSFW. Utilice los filtros incorporados en el sitio)

Monzón Media: Fantástico recurso para tutoriales de ComfyUI para principiantes y avanzados.

Wiki de ComfyUI: Para todas sus necesidades de solución de problemas.

Lista de recursos de ComfyUI: Enlaces para todos los MODELOS Base, CLIPs, y VAEs que pueda necesitar en un solo lugar.

Flujos de trabajo Comfy: Una comunidad dedicada a compartir y descargar flujos de trabajo.

Please share our article, every link counts!
Mail Logo
Rohith Bhaskar, 2025-07- 9 (Update: 2025-07- 9)