gpustack/stable-diffusion-v1-5-GGUF
Versión cuantizada en formato GGUF de Stable Diffusion v1-5, un modelo latente de difusión texto-a-imagen capaz de generar y modificar imágenes a partir de prompts de texto. El repositorio es un espejo no afiliado a RunwayML y se basa en la cuantización de stable-diffusion.cpp parcheada por llama-box. El checkpoint v1-5 fue inicializado desde Stable Diffusion v1-2 y ajustado durante 595.000 pasos a resolución 512x512 sobre LAION aesthetics v2 5+ con eliminación del acondicionamiento textual en el 10% de los casos para mejorar classifier-free guidance.
Como usar
Uso con Diffusers:
from diffusers import StableDiffusionPipeline
import torch
model_id = "sd-legacy/stable-diffusion-v1-5"
pipe = StableDiffusionPipeline.from_pretrained(model_id, torch_dtype=torch.float16)
pipe = pipe.to("cuda")
prompt = "a photo of an astronaut riding a horse on mars"
image = pipe(prompt).images[0]
image.save("astronaut_rides_horse.png")
También puede usarse localmente descargando los pesos para ComfyUI, AUTOMATIC1111, SD.Next o InvokeAI. La versión v1-5-pruned-emaonly.safetensors está orientada a inferencia y usa menos VRAM; v1-5-pruned.safetensors incluye pesos EMA y no EMA, usa más VRAM y es más adecuada para ajuste fino.
Funcionalidades
- Generación texto-a-imagen con arquitectura de difusión latente.
- Formato GGUF con variantes cuantizadas Q4_0, Q4_1 y Q8_0.
- Usa CLIP ViT-L/14 como codificador de texto preentrenado.
- Incluye VAE y componentes cuantizados para ejecución local eficiente.
- Compatible con flujos basados en Diffusers, ComfyUI, AUTOMATIC1111, SD.Next e InvokeAI.
- Tamaños aproximados: Q4_0 1,75 GB, Q4_1 1,76 GB y Q8_0 1,88 GB.
- Licencia CreativeML OpenRAIL-M.
Casos de uso
- Investigación sobre modelos generativos de imágenes.
- Generación de arte, diseño visual y procesos creativos.
- Herramientas educativas o creativas basadas en prompts.
- Estudio de sesgos, limitaciones y despliegue seguro de modelos capaces de generar contenido sensible.
- Prototipado local de flujos texto-a-imagen o imagen-a-imagen con herramientas compatibles con Stable Diffusion.