ostris/Z-Image-De-Turbo

ostris

Texto a imagen

Versión des-destilada de Tongyi-MAI/Z-Image-Turbo, ajustada con imágenes generadas por Z-Image-Turbo para deshacer parte de la destilación turbo. Está pensada para entrenar LoRAs compatibles con el modelo base o para continuar ajustes finos más allá de las limitaciones del modelo turbo original.

Como usar

Puede entrenarse directamente sin adaptador y también usarse para inferencia. Para inferencia, se recomienda usar un CFG bajo, aproximadamente entre 2.0 y 3.0, con 20 a 30 pasos. También parece funcionar bien con normalización de CFG.

Funcionalidades

Modelo de texto a imagen basado en Diffusers y Safetensors.
Licencia Apache 2.0.
Puede usarse directamente para entrenamiento sin adaptador.
Incluye versiones para ComfyUI y para flujos basados en Diffusers.
Compatible con entrenamiento adicional mediante ostris/zimage_turbo_training_adapter.
Diseñado para mantener compatibilidad con el modelo base Tongyi-MAI/Z-Image-Turbo al entrenar LoRAs.

Casos de uso

Generación de imágenes a partir de texto.
Entrenamiento de LoRAs sobre Z-Image-De-Turbo que sigan siendo compatibles con el modelo base.
Ajuste fino extendido cuando el modelo turbo destilado resulta demasiado limitado.
Experimentación en ComfyUI o en pipelines Diffusers.