ostris/Z-Image-De-Turbo
ostris
Texto a imagen
Versión des-destilada de Tongyi-MAI/Z-Image-Turbo, ajustada con imágenes generadas por Z-Image-Turbo para deshacer parte de la destilación turbo. Está pensada para entrenar LoRAs compatibles con el modelo base o para continuar ajustes finos más allá de las limitaciones del modelo turbo original.
Como usar
Puede entrenarse directamente sin adaptador y también usarse para inferencia. Para inferencia, se recomienda usar un CFG bajo, aproximadamente entre 2.0 y 3.0, con 20 a 30 pasos. También parece funcionar bien con normalización de CFG.
Funcionalidades
- Modelo de texto a imagen basado en Diffusers y Safetensors.
- Licencia Apache 2.0.
- Puede usarse directamente para entrenamiento sin adaptador.
- Incluye versiones para ComfyUI y para flujos basados en Diffusers.
- Compatible con entrenamiento adicional mediante ostris/zimage_turbo_training_adapter.
- Diseñado para mantener compatibilidad con el modelo base Tongyi-MAI/Z-Image-Turbo al entrenar LoRAs.
Casos de uso
- Generación de imágenes a partir de texto.
- Entrenamiento de LoRAs sobre Z-Image-De-Turbo que sigan siendo compatibles con el modelo base.
- Ajuste fino extendido cuando el modelo turbo destilado resulta demasiado limitado.
- Experimentación en ComfyUI o en pipelines Diffusers.