calcuis/sd3.5-medium-gguf
calcuis
Texto a imagen
Versión cuantizada en GGUF de Stable Diffusion 3.5 Medium, orientada a generación texto-a-imagen con Diffusers/ComfyUI. Reduce el tamaño del modelo base para poder ejecutarlo en hardware más modesto, incluso CPU antiguas, con variantes de cuantización desde 1 bit hasta F16.
Como usar
Configuración indicada por la página:
Arrastra sd3.5_medium-q5_0.gguf (2.02GB) a ./ComfyUI/models/unet
Arrastra clip_g.safetensors (1.39GB) a ./ComfyUI/models/clip
Arrastra clip_l.safetensors (246MB) a ./ComfyUI/models/clip
Arrastra t5xxl_fp8_e4m3fn.safetensors (4.89GB) a ./ComfyUI/models/clip
Arrastra diffusion_pytorch_model.safetensors (168MB) a ./ComfyUI/models/vae
Ejecución directa descrita:
Ejecuta el archivo .bat en el directorio principal usando el paquete gguf-comfy.
Arrastra el archivo workflow JSON al navegador.
Genera la primera imagen con SD3.
Funcionalidades
- Modelo texto-a-imagen basado en stabilityai/stable-diffusion-3.5-medium.
- Formato GGUF con múltiples cuantizaciones: Q1_0, Q2_K, familia Q3, Q4, Q5, Q6_K, Q8_0 y F16.
- Arquitectura SD3 con tamaño aproximado de 2B parámetros.
- Preparado para flujos de trabajo en ComfyUI usando nodos GGUF.
- Incluye referencias a workflows de ejemplo para GGUF y para safetensors originales.
- Las cuantizaciones Q4 y superiores se describen como adecuadas para producción general a alta calidad; Q3 puede ser usable con ajuste de prompts; Q2_K es muy rápida pero con calidad limitada.
Casos de uso
- Generación de imágenes a partir de texto en ComfyUI.
- Ejecución local de Stable Diffusion 3.5 Medium con menor consumo de memoria.
- Pruebas de calidad y velocidad entre distintas cuantizaciones GGUF.
- Uso en equipos antiguos o con recursos limitados donde el modelo original en safetensors sería demasiado pesado.
- Producción visual general con variantes Q4 o superiores.