felipedpm/z-image-turbo-GGUF-confyui
Versión GGUF cuantizada de z-image-turbo para generación de imágenes en ComfyUI. El repositorio empaqueta el UNET de difusión z_image_turbo en Q8_0 y el codificador de texto Qwen3 4B en Q5_K_XL para ejecutar el flujo con menor consumo de VRAM que los pesos completos, aunque sigue siendo exigente. Está orientado a usuarios que quieren correr Z-Image Turbo localmente con nodos GGUF en ComfyUI y aprovechar un workflow ya preparado.
Como usar
Instalación y uso principal en ComfyUI: mover models/unet/z_image_turbo-Q8_0.gguf a ComfyUI/models/unet/, mover models/text_encoders/Qwen3-4B-UD-Q5_K_XL.gguf a ComfyUI/models/clip/ o ComfyUI/models/text_encoders/ según el cargador, y mover models/vae/ae.safetensors a ComfyUI/models/vae/. Después, cargar el UNET con UnetLoaderGGUF y el codificador de texto Qwen3 4B con un loader CLIP/Text Encoder compatible con GGUF.
Ejemplo con llama-cpp-python mostrado en la página:
# !pip install llama-cpp-python
from llama_cpp import Llama
llm = Llama.from_pretrained(
repo_id="felipedpm/z-image-turbo-GGUF-confyui",
filename="models/text_encoders/Qwen3-4B-UD-Q5_K_XL.gguf",
)
llm.create_chat_completion(
messages = "\"Astronaut riding a horse\""
)
Ejemplo con llama.cpp:
brew install llama.cpp
llama-server -hf felipedpm/z-image-turbo-GGUF-confyui:UD-Q5_K_XL
llama-cli -hf felipedpm/z-image-turbo-GGUF-confyui:UD-Q5_K_XL
Ejemplo con Ollama:
ollama run hf.co/felipedpm/z-image-turbo-GGUF-confyui:UD-Q5_K_XL
Ejemplo con Docker Model Runner:
docker model run hf.co/felipedpm/z-image-turbo-GGUF-confyui:UD-Q5_K_XL
Funcionalidades
- Modelo de texto a imagen basado en Z-Image Turbo, preparado para flujos de ComfyUI.
- Pesos GGUF para dos componentes principales: UNET z_image_turbo-Q8_0.gguf y codificador de texto Qwen3-4B-UD-Q5_K_XL.gguf.
- Incluye VAE ae.safetensors para decodificación de imagen dentro del pipeline.
- Optimizado para entornos con VRAM limitada frente a pesos sin cuantizar, con requisito mínimo indicado de 12 GB de VRAM.
- Compatible con nodos personalizados capaces de cargar GGUF, como ComfyUI-GGUF de City96.
- Arquitectura asociada al codificador Qwen3 de 4B parámetros, con cuantizaciones UD-Q5_K_XL de 2.91 GB y Q8_0 de 7.22 GB.
- Licencia Apache 2.0.
Casos de uso
- Generar imágenes localmente con Z-Image Turbo dentro de ComfyUI usando pesos GGUF.
- Ejecutar workflows de texto a imagen en equipos con 12 GB de VRAM, aceptando posible descarga a RAM del sistema.
- Probar una versión cuantizada del pipeline Z-Image Turbo sin descargar o cargar pesos completos más pesados.
- Construir flujos personalizados de ComfyUI que combinen UNET GGUF, codificador Qwen3 cuantizado y VAE estándar.