calcuis/sd3.5-medium-gguf

calcuis

Texto a imagen

Versión cuantizada en GGUF de Stable Diffusion 3.5 Medium, orientada a generación texto-a-imagen con Diffusers/ComfyUI. Reduce el tamaño del modelo base para poder ejecutarlo en hardware más modesto, incluso CPU antiguas, con variantes de cuantización desde 1 bit hasta F16.

Como usar

Configuración indicada por la página:
Arrastra sd3.5_medium-q5_0.gguf (2.02GB) a ./ComfyUI/models/unet
Arrastra clip_g.safetensors (1.39GB) a ./ComfyUI/models/clip
Arrastra clip_l.safetensors (246MB) a ./ComfyUI/models/clip
Arrastra t5xxl_fp8_e4m3fn.safetensors (4.89GB) a ./ComfyUI/models/clip
Arrastra diffusion_pytorch_model.safetensors (168MB) a ./ComfyUI/models/vae

Ejecución directa descrita:
Ejecuta el archivo .bat en el directorio principal usando el paquete gguf-comfy.
Arrastra el archivo workflow JSON al navegador.
Genera la primera imagen con SD3.

Funcionalidades

Modelo texto-a-imagen basado en stabilityai/stable-diffusion-3.5-medium.
Formato GGUF con múltiples cuantizaciones: Q1_0, Q2_K, familia Q3, Q4, Q5, Q6_K, Q8_0 y F16.
Arquitectura SD3 con tamaño aproximado de 2B parámetros.
Preparado para flujos de trabajo en ComfyUI usando nodos GGUF.
Incluye referencias a workflows de ejemplo para GGUF y para safetensors originales.
Las cuantizaciones Q4 y superiores se describen como adecuadas para producción general a alta calidad; Q3 puede ser usable con ajuste de prompts; Q2_K es muy rápida pero con calidad limitada.

Casos de uso

Generación de imágenes a partir de texto en ComfyUI.
Ejecución local de Stable Diffusion 3.5 Medium con menor consumo de memoria.
Pruebas de calidad y velocidad entre distintas cuantizaciones GGUF.
Uso en equipos antiguos o con recursos limitados donde el modelo original en safetensors sería demasiado pesado.
Producción visual general con variantes Q4 o superiores.