drbaph/Z-Image-fp8

drbaph

Texto a imagen

Versión cuantizada en FP8 del modelo Z-Image para generación de imágenes a partir de texto, optimizada para flujos de trabajo en ComfyUI. Reduce de forma importante el consumo de VRAM y acelera la inferencia manteniendo una alta calidad visual, lo que facilita usar Z-Image en GPUs de consumo.

Como usar

Usar el modelo dentro de un flujo de trabajo de ComfyUI compatible con Z-Image y seleccionar una de las variantes cuantizadas FP8 disponibles. La página no incluye un fragmento de código ejecutable; menciona un workflow de ComfyUI y parámetros de ejemplo como Steps: 30, CFG: 4, sampler Euler y una semilla de referencia.

Funcionalidades

Generación texto-a-imagen basada en Diffusers.
Compatibilidad completa con ComfyUI.
Cuantización FP8 en formatos fp8-e4m3fn-scaled, fp8-e4m3fn, fp8_e5m2-scaled y fp8_e5m2.
Ahorro aproximado del 50% de VRAM frente a la versión BF16.
Inferencia más rápida con degradación mínima de calidad.
Modelo base no destilado con soporte para CFG y prompts negativos.
Alta diversidad de composición, identidad facial, iluminación y estilos visuales.
Adecuado como base para LoRA, ControlNet y condicionamiento semántico.

Casos de uso

Generación de imágenes de alta calidad con menor consumo de memoria GPU.
Producción creativa en ComfyUI en equipos con GPUs de consumo.
Exploración visual con alta variabilidad entre semillas.
Prompt engineering complejo con CFG y prompts negativos.
Creación de fotografía hiperrealista, arte digital cinematográfico, anime e ilustración estilizada.
Entrenamiento o adaptación comunitaria mediante LoRA y flujos con ControlNet.