pseudo-flex-v2
bghira
Texto a imagen
Este es un modelo afinado completamente derivado de stabilityai/stable-diffusion-2-1. El prompt de validación principal utilizado durante el entrenamiento fue: una escena cinematográfica de la película Rogue One, una mujer mira a lo lejos, sosteniendo un letrero que dice PRONTO. Nota: Las configuraciones de validación no son necesariamente las mismas que las configuraciones de entrenamiento.
Como usar
### Configuraciones de Validación
- CFG: 9.2
- CFG Rescale: 0.7
- Pasos: 30
- Sampler: euler
- Seed: 420420420
- Resoluciones: 1024x1024, 1152x960, 896x1152
El codificador de texto no fue entrenado. Puede reutilizar el codificador de texto del modelo base para la inferencia.
### Configuraciones de Entrenamiento
- Épocas de entrenamiento: 4
- Pasos de entrenamiento: 48700
- Tasa de aprendizaje: 4e-07
- Tamaño efectivo de lote: 32
- Tamaño de micro-lote: 4
- Pasos de acumulación de gradiente: 8
- Tipo de predicción: v_prediction
- Betas re-escalados con SNR cero: True
- Optimizador: AdamW, bf16 estocástico
- Precisión: BF16 puro
- Xformers: Habilitado
Funcionalidades
- Modelo de difusión de texto a imagen
- Usa safetensors
- Licencia: creativeml-openrail-m
- Afinado a partir del modelo base stabilityai/stable-diffusion-2-1
Casos de uso
- Generación de imágenes cinematográficas
- Creación de carteles de películas
- Representaciones de escenas artísticas
- Exploración de diferentes estilos visuales