GuangyuanSD/Z-Image-Distilled

GuangyuanSD
Texto a imagen

Versión destilada y acelerada de Z-Image basada en la rama no-Turbo, orientada a generar imágenes con muchas menos iteraciones sin perder demasiada diversidad, compatibilidad con LoRA ni libertad estilística. La serie incluye variantes V1, V2, V3 y DPO como “Veris” y “AGILE”, con mejoras progresivas en velocidad, realismo, fidelidad de color, iluminación, materiales y alineación de LoRAs.

Como usar

Instrucciones principales de uso:

  • Flujo básico: usar el workflow oficial de Z-Image-Turbo, ya que es compatible.
  • V1 recomendado: CFG 1.0-2.5, preferiblemente 1.0-1.8; 10-20 pasos; 10 para previews rápidos y 15-20 para calidad más estable.
  • V2 recomendado: CFG 1.0; 10-15 pasos; sampler/scheduler Euler/simple.
  • V3 “Lucis” recomendado: CFG 1.0-1.5, preferiblemente 1.0; 5-15 pasos; sampler/scheduler Euler/simple.
  • LoRA: buena compatibilidad; peso recomendado 0.6-1.0, ajustable según el modelo fine-tune ZIB/ZIT y el estilo buscado.
  • Puede combinarse con Klein 9B para refinamiento en cascada, ensemble generation o prototipado rápido.
  • En DPO “Veris”, se destaca el uso para generaciones realistas rápidas, alineación de LoRA mejorada y prototipos con baja latencia.
  • No hay proveedores de inferencia desplegados directamente en Hugging Face para este modelo.

Funcionalidades

Modelo de texto a imagen en formato Safetensors con licencia Apache-2.0.
Destilación acelerada de Z-Image non-Turbo, sin incorporar pesos ni estilo de Z-Image-Turbo en la V1.
Generación mucho más rápida que Z-Image oficial: V1 funciona bien en 10-20 pasos, V3 “Lucis” apunta a resultados sólidos desde 5 pasos y DPO “Veris” a resultados realistas en 8 pasos.
Mejor compatibilidad con LoRAs frente a Turbo, con pesos recomendados ajustables y versiones LoRA destiladas Rank-256 disponibles.
Variantes DPO como “Veris” mejoran iluminación, fidelidad de color, autenticidad de materiales y reproducción de LoRAs.
Variante “AGILE” reduce peso DPO/destilado para conservar más libertad estocástica, diversidad visual y riqueza de contenido.
Compatible con ComfyUI y con flujos de trabajo tipo Z-Image-Turbo; prefijo de capas indicado como model.diffusion_model.
Soporta ecosistema ZIB, flujos híbridos con Klein 9B y uso como fuente rápida de pre-muestreo para pipelines ZiTurbo.
Versiones cuantizadas disponibles o mencionadas, incluyendo FP8 mixed, NVFP4 para GPUs Blackwell y DF11 lossless compression.

Casos de uso

Entrenar, probar y validar LoRAs sobre la base Z-Image non-Turbo con iteraciones mucho más rápidas.
Generación artística, ilustración, concept art y diseños que se benefician de variedad aleatoria y libertad estilística.
Prototipado rápido de hipótesis de entrenamiento LoRA con baja latencia.
Generaciones realistas rápidas con mejor iluminación, color y materiales usando variantes DPO como “Veris”.
Pre-muestreo estocástico de alta entropía para pipelines ZiTurbo o ZImage.
Flujos híbridos donde Z-Image-Distilled produce una base rápida y Klein 9B u otros modelos refinan o combinan resultados.
Uso de LoRAs ZIB existentes con respuesta rápida y mejor reproducción en variantes recientes como AGILE.