Cómo instalar Stable Diffusion localmente
Stable Diffusion es un modelo de generación de imágenes que ha tomado por asalto la comunidad de inteligencia artificial. Este modelo permite generar imágenes a partir de texto de manera sorprendentemente detallada y realista. Si bien es posible utilizar Stable Diffusion a través de plataformas en línea, instalarlo localmente ofrece mayor control y la posibilidad de experimentar más libremente. En este artículo, te guiaremos a través del proceso de instalación de Stable Diffusion en tu máquina local.
Requisitos previos
Antes de proceder con la instalación, asegúrate de que tu máquina cumple con los siguientes requisitos:
-
Hardware:
- GPU: Una tarjeta gráfica NVIDIA moderna con al menos 6 GB de VRAM. Se recomienda tener una GPU compatible con CUDA.
- RAM: Mínimo 16 GB. Cuanta más memoria tengas, mejor será el rendimiento.
-
Software:
- Sistema operativo: Windows, macOS o Linux.
- Python: Se recomienda tener instalada la versión 3.8 o superior.
- Git: Para clonar el repositorio de Stable Diffusion.
- CUDA y cuDNN: Si usas una GPU NVIDIA, asegúrate de instalar las versiones correctas de CUDA y cuDNN para que PyTorch funcione adecuadamente.
Instalación de los requisitos
-
Instalar Python:
Puedes descargar Python desde la página oficial. Asegúrate de marcar la opción «Add Python to PATH» durante la instalación. -
Instalar Git:
Descarga Git desde la página oficial y sigue las instrucciones de instalación. -
Instalar CUDA y cuDNN:
Visita las páginas de CUDA y cuDNN para descargarlos e instalarlos. Asegúrate de que las versiones sean compatibles con tu versión de PyTorch.
Instalación de Stable Diffusion
Una vez que tengas todos los requisitos previos instalados, sigue estos pasos para configurar Stable Diffusion en tu máquina local.
Paso 1: Clonar el repositorio de Stable Diffusion
Abre una terminal (o CMD en Windows) y navega a la carpeta donde deseas instalar Stable Diffusion. Luego ejecuta el siguiente comando:
git clone https://github.com/CompVis/stable-diffusion
Esto descargará el código fuente de Stable Diffusion en tu máquina.
Paso 2: Crear un entorno virtual
Es recomendable crear un entorno virtual para manejar las dependencias del proyecto. Para ello, sigue estos pasos:
cd stable-diffusion
python -m venv venv
Luego, activa el entorno virtual:
-
En Windows:
venvScriptsactivate
-
En macOS/Linux:
source venv/bin/activate
Paso 3: Instalar las dependencias
Con el entorno virtual activado, instala las dependencias necesarias para ejecutar Stable Diffusion. Ejecuta el siguiente comando:
pip install -r requirements.txt
Esto instalará todas las bibliotecas requeridas, incluidas PyTorch y otras dependencias necesarias.
Paso 4: Descargar el modelo pre-entrenado
Para generar imágenes, necesitarás descargar el modelo pre-entrenado de Stable Diffusion. Este modelo no se incluye en el repositorio por cuestiones de tamaño. Puedes encontrar el modelo en el Hugging Face Model Hub o en otras fuentes. Necesitarás crear una cuenta en Hugging Face para poder acceder a los modelos.
- Accede al modelo y acepta los términos del uso.
- Luego descarga el archivo del modelo (en formato
.ckpt
) y colócalo en la carpeta del proyecto.
Paso 5: Configuración final
Asegúrate de que el modelo sea accesible desde el código. Si descargaste el modelo con el nombre por defecto, simplemente asegúrate de que el archivo model.ckpt
esté en la carpeta correcta o cambie la referencia en el código de carga del modelo.
Paso 6: Ejecutar Stable Diffusion
Con la instalación y configuración completas, ahora puedes probar generar imágenes. Crea un archivo Python (por ejemplo, generate.py
) en la carpeta del proyecto y añade el siguiente código:
import torch
from torchvision import transforms
from PIL import Image
from diffusers import StableDiffusionPipeline
# Cargar modelo
model_path = "ruta/a/tu/modelo.ckpt"
pipe = StableDiffusionPipeline.from_pretrained(model_path, torch_dtype=torch.float16)
pipe = pipe.to("cuda") # Asegúrate de que esté en la GPU
# Generar imagen
prompt = "Un hermoso paisaje al atardecer"
image = pipe(prompt)["sample"][0]
# Guardar imagen
image.save("imagen_generada.png")
Cambia ruta/a/tu/modelo.ckpt
por la ruta real del archivo .ckpt
que descargaste.
Paso 7: Ejecutar el script
Dentro de la terminal y con el entorno virtual activado, ejecuta el script Python para generar la imagen:
python generate.py
Esto debería generar una imagen basada en el texto proporcionado y guardarla en el directorio del proyecto.
Consejos adicionales
-
Opciones de ajuste: Experimenta con diferentes prompts y ajusta los parámetros del modelo para obtener resultados variados. Puedes explorar la cantidad de pasos de inferencia, la guía de escala, y otros parámetros que controlan el proceso de generación.
-
Uso de otras bibliotecas: Stable Diffusion se puede integrar con otras bibliotecas como OpenCV o PIL para mejorar la manipulación de imágenes generadas.
-
Optimización de recursos: Si experimentas problemas de memoria, considera reducir la resolución de la imagen generada o utilizar técnicas de optimización como el uso de precisión mixta.
-
Documentación: No dudes en consultar la documentación oficial de Stable Diffusion para obtener información más detallada sobre el uso y las características avanzadas del modelo.
Conclusión
Instalar Stable Diffusion localmente te permite explorar el fascinante mundo de la generación de imágenes AI desde tu propio entorno. A medida que domines el uso del modelo, podrás crear visuales impresionantes que pueden ser utilizados en proyectos artísticos, de diseño y más. Con las instrucciones de este artículo, deberías estar bien equipado para comenzar tu viaje en la generación de imágenes con inteligencia artificial. ¡Buena suerte!