felipedpm/z-image-turbo-GGUF-confyui

felipedpm

Texto a imagen

Versión GGUF cuantizada de z-image-turbo para generación de imágenes en ComfyUI. El repositorio empaqueta el UNET de difusión z_image_turbo en Q8_0 y el codificador de texto Qwen3 4B en Q5_K_XL para ejecutar el flujo con menor consumo de VRAM que los pesos completos, aunque sigue siendo exigente. Está orientado a usuarios que quieren correr Z-Image Turbo localmente con nodos GGUF en ComfyUI y aprovechar un workflow ya preparado.

Como usar

Instalación y uso principal en ComfyUI: mover models/unet/z_image_turbo-Q8_0.gguf a ComfyUI/models/unet/, mover models/text_encoders/Qwen3-4B-UD-Q5_K_XL.gguf a ComfyUI/models/clip/ o ComfyUI/models/text_encoders/ según el cargador, y mover models/vae/ae.safetensors a ComfyUI/models/vae/. Después, cargar el UNET con UnetLoaderGGUF y el codificador de texto Qwen3 4B con un loader CLIP/Text Encoder compatible con GGUF.
Ejemplo con llama-cpp-python mostrado en la página:
# !pip install llama-cpp-python
from llama_cpp import Llama

llm = Llama.from_pretrained(
    repo_id="felipedpm/z-image-turbo-GGUF-confyui",
    filename="models/text_encoders/Qwen3-4B-UD-Q5_K_XL.gguf",
)

llm.create_chat_completion(
    messages = "\"Astronaut riding a horse\""
)

Ejemplo con llama.cpp:
brew install llama.cpp
llama-server -hf felipedpm/z-image-turbo-GGUF-confyui:UD-Q5_K_XL
llama-cli -hf felipedpm/z-image-turbo-GGUF-confyui:UD-Q5_K_XL

Ejemplo con Ollama:
ollama run hf.co/felipedpm/z-image-turbo-GGUF-confyui:UD-Q5_K_XL

Ejemplo con Docker Model Runner:
docker model run hf.co/felipedpm/z-image-turbo-GGUF-confyui:UD-Q5_K_XL

Funcionalidades

Modelo de texto a imagen basado en Z-Image Turbo, preparado para flujos de ComfyUI.
Pesos GGUF para dos componentes principales: UNET z_image_turbo-Q8_0.gguf y codificador de texto Qwen3-4B-UD-Q5_K_XL.gguf.
Incluye VAE ae.safetensors para decodificación de imagen dentro del pipeline.
Optimizado para entornos con VRAM limitada frente a pesos sin cuantizar, con requisito mínimo indicado de 12 GB de VRAM.
Compatible con nodos personalizados capaces de cargar GGUF, como ComfyUI-GGUF de City96.
Arquitectura asociada al codificador Qwen3 de 4B parámetros, con cuantizaciones UD-Q5_K_XL de 2.91 GB y Q8_0 de 7.22 GB.
Licencia Apache 2.0.

Casos de uso

Generar imágenes localmente con Z-Image Turbo dentro de ComfyUI usando pesos GGUF.
Ejecutar workflows de texto a imagen en equipos con 12 GB de VRAM, aceptando posible descarga a RAM del sistema.
Probar una versión cuantizada del pipeline Z-Image Turbo sin descargar o cargar pesos completos más pesados.
Construir flujos personalizados de ComfyUI que combinen UNET GGUF, codificador Qwen3 cuantizado y VAE estándar.