
Guía: Así se generan imágenes en su PC de forma gratuita
CheckMag
¿Desea generar imágenes en su PC sin depender de los servicios en la nube? Esta guía le guiará a través de la configuración de herramientas gratuitas y de código abierto para un control creativo total sin suscripciones.Rohith Bhaskar, ✓ Rohith Bhaskar (traducido por Ninh Duy) Publicado 🇺🇸 🇫🇷 ...
Las herramientas de generación de imágenes son cada vez más capaces de crear imágenes fotorrealistas de última generación. Por desgracia, la mayoría de ellas están bloqueadas en línea tras un muro de pago, pero ¿y si le dijera que hay una forma de ejecutarlas localmente con mucha más flexibilidad que la que ofrecen las herramientas en línea?
Requisitos previos
1) Una tarjeta gráfica Nvidia con un mínimo de 8 GB de VRAM. (Se recomienda RTX 3060 o superior )
2) Un mínimo de 16GB de memoria de sistema DDR4. (Cuanta más tenga, mejor )
3) Windows 10/11 (sistema operativo de 64 bits necesario )
4) Un mínimo de 100-150 GB de espacio libre en el disco duro para configurarlo todo y descargar los modelos.
5) Una conexión a Internet para la configuración inicial. (Necesaria sólo para descargar e instalar frontends de interfaz de usuario y modelos de imagen )
Nota: Las GPU de AMD o Intel no son compatibles oficialmente con la mayoría de los frontends de interfaz de usuario y requieren soluciones alternativas para funcionar.
Lo primero que debe hacer es asegurarse de que está ejecutando los últimos controladores de estudio de Nvidia para su tarjeta gráfica. Si no está seguro de la GPU Nvidia que tiene instalada, haga clic con el botón derecho del ratón en cualquier lugar del escritorio y haga clic en "Panel de control NVIDIA" en el menú contextual.
Ahora, busque "Información del sistema" en la parte inferior de la página que se abre. Debería ver el nombre de su tarjeta gráfica a la izquierda, junto con más información si fuera necesario.
Top 10 Análisis
» Top 10 Portátiles Multimedia
» Top 10 Portátiles de Juego
» Top 10 Portátiles de Juego ligeros
» Top 10 Portátiles Asequibles de Oficina/Empresa
» Top 10 Portátiles de Juego Ligeros
» Top 10 Portátiles de Oficina/Empresa Premium
» Top 10 Estaciones de Trabajo
» Top 10 Subportátiles
» Top 10 Ultrabooks
» Top 10 Convertibles
» Top 10 Tablets
» Top 10 Tablets Windows
» Top 10 Tablets de menos de 250 Euros
» Top 10 Phablets (>5.5")
» Top 10 Smartphones
» Top 10 Smartphones (≤5")
» Top 10 Smartphones de menos de 300 Euros
» Top 10 Smartphones de menos de 120 Euros
» Top 10 Portátiles de menos de 1000 Euros
» Top 10 Portátiles de menos de 500 Euros
» Top 10 Portátiles de menos de 300 Euros
» Los Mejores Displays de Portátiles Analizados por Notebookcheck
Abra el repositorio oficial de controladores de Nvidia aquí, busque Controladores Nvidia Studio y haga clic en Descargar. Esto abrirá una página para que descargue el controlador más reciente. Ahora, vale la pena comprobar si su producto Nvidia es compatible con el controlador. Puede hacerlo haciendo clic en "Productos compatibles", justo debajo del botón de descarga. Instale los controladores y reinicie su PC.
Nota: Esto sobrescribirá los controladores Game Ready si los tiene instalados. Si su sistema es principalmente para juegos, puede que vea reducido su rendimiento en los juegos.
Estupendo El primer paso ya está completo. Ahora, podemos pasar a las cosas divertidas, como la descarga de frontends de interfaz de usuario. Recomiendo encarecidamente descargar e instalar Stability Matrix. Es una herramienta de mantenimiento todo en uno que soporta múltiples frontends de interfaz de usuario y los mantiene actualizados automáticamente. Incluso crea carpetas compartidas para modelos y salidas que puede ver en un solo lugar.
En la página GitHub de https://github.com/LykosAI/StabilityMatrix?tab=readme-ov-file#%EF%B8%8F-one-click-install-and-update-for-stable-diffusion-web-ui-packagesdesplácese hasta la sección readme y busque su sistema operativo. Stability Matrix también ofrece descargas para Linux y Mac. A efectos de esta guía, utilizaremos la versión para Windows.
Haga clic en el botón del sistema operativo, y debería pedirle que descargue un archivo .zip. Deberá colocarlo en la unidad en la que desee instalar Stability Matrix. Asegúrese de que dispone de al menos 100-150 GB de espacio libre en la unidad. Esto no es sólo para instalar Stability Matrix, sino también para descargar los modelos necesarios, los codificadores de texto y otros archivos del sistema. Estos se suman muy rápidamente.
Una vez que haya descargado el archivo, descomprímalo y ejecute el archivo StabilityMatrix.exe que se encuentra dentro de la carpeta extraída. Debería descargar automáticamente todos los archivos necesarios y configurar la interfaz por usted.
¡Fantástico! Ahora tenemos una interfaz para descargar e instalar múltiples interfaces de usuario.
Ahora, es el momento de decidir el front-end que desea utilizar. Un frontend es una interfaz gráfica de usuario (GUI) que le permite interactuar con los modelos de imagen, manipular los ajustes y, lo que es más importante, generar imágenes.
Busque el botón "Añadir paquete" en la parte inferior y haga clic en él para que aparezcan las distintas opciones.
He aquí una lista rápida de las opciones que ofrece la Matriz de Estabilidad.
1) Difusión estable Forja WebUI
2) Difusión estable WebUI Forge - Clásica
4) Foooocus
5) Fooocus - Edición 1-Up de mashb1t
7) SwarmUI
8) Cogstudio
10) RuinedFooocus
11) SD.Next
12) SDFX
13) InvokeAI
Personalmente, recomendaría encarecidamente el uso de ComfyUI. Es una aplicación visual basada en nodos que puede parecer un poco intimidante al principio, pero es sorprendentemente fácil acostumbrarse a ella. Recuerde que Stability Matrix puede gestionar múltiples frontends, por lo que no tiene por qué limitarse a uno solo. Puede experimentar y encontrar la que más le convenga.
Utilice la lista anterior y navegue hasta las páginas de GitHub de cada paquete. Tómese su tiempo y aprenda más sobre cada paquete antes de hacer una elección.
Para los propósitos de esta guía, le guiaré a través de la descarga e instalación de ComfyUI, junto con algunas extensiones útiles que deberían servirle bien.
Instalación y configuración de ComfyUI
Abra Stability Matrix y haga clic en el botón "Añadir paquete". Ahora encuentre "ComfyUI" en la lista de paquetes ofrecidos y haga clic en él. En la página que se abre, asegúrese de que "master" está seleccionado en el cuadro desplegable. La versión "master" es la más estable y la recomendada para la mayoría de los usuarios.
Una vez que haga clic en Instalar, Stability Matrix comenzará a descargar el paquete por usted. Espere a que termine. Puede tardar unos minutos en descargarse, así que no dude en seguir utilizando su sistema mientras tanto. Si el cuadro de descarga se cierra o si pulsa accidentalmente "Ocultar", utilice el botón de descargas de la parte inferior para ver el estado de su descarga actual.
Una vez instalado, debería ver una notificación emergente sobre su bandeja de sistema informándole de que ComfyUI está listo para su uso.
Vuelva a Paquetes, y verá el mosaico de ComfyUI en la página, pero no lo inicie todavía. ComfyUI está configurado para lanzarse en modo VRAM Normal para GPUs con 12GB VRAM o superior por defecto. Si tienes una tarjeta de 8GB VRAM, ahora es un buen momento para forzar el lanzamiento de Comfy en modo VRAM Baja.
A continuación, tenemos que instalar el ComfyUI Manager. Es un componente crítico que le permite instalar y gestionar varios nodos personalizados dentro de la aplicación. Haga clic en el icono Jigsaw de la derecha y escriba "ComfyUI-Manager" en la sección "Extensiones disponibles". Selecciónela y haga clic en Instalar en la parte inferior. Una vez que haya terminado de instalarse, debería ver "(instalado)" junto a él. Ahora, ya estamos listos para iniciar ComfyUI.
Inicie ComfyUI y deje que se ejecute a través del proceso de arranque. Una vez hecho, se abrirá automáticamente en una nueva pestaña de su navegador por defecto. Si no lo hace, vuelva a la pestaña Paquetes y haga clic en WebUI en el azulejo ComfyUI ahora de color verde.
Enhorabuena Ya ha terminado con todos los requisitos previos. Ahora, pasemos a lo bueno, descargar y utilizar modelos de imagen.
Descarga y utilización de su primer modelo de imagen
Antes de empezar a descargar modelos de imagen, repasemos un glosario de términos con los que debería estar familiarizado.
1) UNET/Punto de control/Modelo de difusión/Difusores - El gran jefe. El cerebro de la operación, piense en él como el artista que pinta utilizando sus palabras.
2) Tokenizador - El cronometrador. Convierten sus indicaciones en tokens para incrustarlos antes de que los codificadores de texto tomen el relevo. Dependiendo del modelo, estará limitado a un número determinado de tokens (palabras) que puede utilizar.
3) Codificadores de texto/CLIP - Los pesos pesados. Convierten sus indicaciones de texto en entradas digitales que el UNET puede entender.
4) Muestreadores - El conductor maestro. Guían iterativamente el proceso de generación de imágenes, refinándolas desde el ruido hasta la salida final.
5) VAE - El equipo de limpieza. Limpian el ruido tras la fase de generación y ayudan a mejorar la calidad de la imagen.
Ahora, se encontrará con más términos en su viaje, pero estos son los básicos que definirán todo a partir de este punto. No se preocupe demasiado por entrar en detalles sobre ellos todavía.
Inicie ComfyUI y debería abrir una ventana de flujo de trabajo limpia para empezar. Haga clic en "Flujo de trabajo" en la parte superior izquierda y luego en "Examinar plantillas"
Se abrirá una ventana con flujos de trabajo de ejemplo ya configurados para usted. Haga clic en "Conceptos básicos" y luego en "Generación de imágenes" Inmediatamente verá un error en la pantalla informándole de que faltan modelos. Esto se debe a que aún no hemos descargado un modelo de imagen. Sigamos adelante y hagámoslo. Haga clic en descargar.
Mientras se descarga el archivo, detengámonos en algunas diferencias entre los distintos modelos que verá. Lo que estamos descargando ahora mismo es el Stable Diffusion 1.5 modelo base. En el lienzo de ComfyUI, habrá notado tres conexiones separadas desde el primer nodo "Load Checkpoint". Una para MODEL, CLIP y VAE.
Esto se debe a que los tres están incluidos en este punto de control base, y no necesita utilizar CLIPs y VAE por separado para este modelo en particular.
Los modelos de imagen más recientes, sin embargo, como Flux o HiDreamrequieren que los descargue por separado, así que téngalo en cuenta. Afortunadamente, disponen de plantillas de ejemplo como ésta, por lo que no tendrá que preocuparse de configurarlo todo. Hablaremos de eso más adelante. Por ahora, vamos a generar nuestra primera imagen.
Ahora, si hace clic en el botón Ejecutar en la parte inferior derecha, se dará cuenta de que ComfyUI todavía le da un error. Eso es porque el modelo necesita ser colocado en la carpeta correcta para que Comfy lo reconozca. Ahora, vaya a la carpeta donde descargó el modelo en el Explorador de archivos y cópielo.
Observará que el nombre del archivo tiene una extensión ".SAFETENSORS,". Este es el formato que utiliza el archivo. Como regla general, sólo descargue archivos con la extensión .safetensors. No descargue tensores pickle o .pth. Confíe en mí¡!
Abra la carpeta donde instaló Stability Matrix, y busque una carpeta llamada "Models" Haga doble clic en ella, y busque una subcarpeta llamada "StableDiffusion", pegue el archivo .safetensors dentro de ella.
Para futuras referencias. Los modelos con CLIPS y VAE incluidos deben colocarse en la carpeta "StableDiffusion". Los modelos con sólo el UNET (sin CLIP ni VAE) se colocarán en la carpeta "DiffusionModels". Los codificadores de texto (T5, Llama, CLIP L, CLIP G) deben colocarse en la carpeta "TextEncoders". Por último, sus archivos VAE se colocan en la carpeta "VAE".
Como probablemente pueda ver, hay muchas más carpetas que sólo esas tres. Mi consejo es que lo resuelva cuando llegue a ellas. Por ahora, preocupémonos de nuestra imagen.
Actualice la página web de ComfyUI en su navegador. Haga clic en el cuadro de diálogo del nodo "Cargar punto de control" y seleccione su archivo descargado.
Dado que se trata de una plantilla, todo está ya configurado para usted. Sin embargo, merece la pena conocer los fundamentos básicos para sus futuros flujos de trabajo. Empecemos por la izquierda. Ya hemos hablado del nodo "Punto de control de carga", y junto a él hay dos nodos "CLIP Text Encode (Prompt)".
El de arriba es el de las indicaciones positivas o lo que se quiere ver en la imagen. El de abajo es la entrada para las indicaciones negativas o lo que no quiere ver en la salida final. Generar imágenes es el equilibrio de estos dos nodos combinados. Usted crea una imagen, marca lo que no le gusta de ella e introduce eso en la indicación negativa. Por ahora, estos ya están introducidos para nosotros, así que hagamos clic en "Ejecutar"
ComfyUI es una interfaz visual, lo que significa que realmente puede ver el proceso sucediendo nodo por nodo. Una vez que su texto está codificado, se envía al "KSampler", que comienza a iterar la imagen. Repasemos rápidamente todos los ajustes de este nodo.
1) Semilla: Piense en ella como la dirección de la imagen. Misma indicación positiva + indicación negativa + mismos ajustes + misma semilla = la misma imagen. Útil para recrear e iterar sobre una imagen.
2) Control tras la generación: Determina si la semilla se aleatorizará después de cada generación o si debe permanecer fija.
3) Pasos: El número de pasos que debe iterar el KSampler. La mayoría de los modelos vienen con pasos recomendados.
4) CFG: La capacidad de respuesta del modelo a sus indicaciones. Valores más altos = cumplimiento estricto de las indicaciones pero menos creatividad. Valores más bajos = resultados más creativos a costa de la adherencia a las indicaciones.
5) Sampler_name: el nombre del muestreador que está utilizando actualmente. Haga clic en el desplegable para ver más opciones. Experimente con diferentes ajustes y muestreadores para obtener salidas variadas.
6) Programador: Piense en él como el segundo al mando que idea estrategias que el director de orquesta aprueba. De nuevo, experimente con diferentes muestreadores y programadores para encontrar el que le funcione.
7) Eliminación de ruido: Determina la cantidad de ruido que se añade al principio del proceso de generación. Éste es eliminado de forma iterativa por el muestreador. El valor no puede fijarse por encima de 1,00, y los valores inferiores (0,45 o 0,65) se utilizan principalmente en los flujos de trabajo de imagen a imagen, refinador o inpainting.
La entrada latent_image situada a la izquierda del nodo KSampler determina el tamaño de la imagen. En el flujo de trabajo, está conectada a un nodo "Imagen latente vacía" con una resolución de 512x512 y un tamaño de lote (el número de imágenes generadas en una ejecución) de 1.
Ahora, ¡mire esto! Nuestra primera imagen. Si ha llegado hasta aquí, ¡enhorabuena! Ahora conoce lo más básico para empezar su viaje en la generación de imágenes. Cuanto más experimente, más descubrirá, y esta madriguera de conejos es muy profunda. Así que diviértase.
Enlaces útiles
CivitAI: Su ventanilla única para descargar modelos, LoRAs, incrustaciones y mucho más. (Precaución: incluye contenido NSFW. Utilice los filtros incorporados en el sitio)
Monzón Media: Fantástico recurso para tutoriales de ComfyUI para principiantes y avanzados.
Wiki de ComfyUI: Para todas sus necesidades de solución de problemas.
Lista de recursos de ComfyUI: Enlaces para todos los MODELOS Base, CLIPs, y VAEs que pueda necesitar en un solo lugar.
Flujos de trabajo Comfy: Una comunidad dedicada a compartir y descargar flujos de trabajo.