pseudo-flex-v2

bghira

Texto a imagen

Este es un modelo afinado completamente derivado de stabilityai/stable-diffusion-2-1. El prompt de validación principal utilizado durante el entrenamiento fue: una escena cinematográfica de la película Rogue One, una mujer mira a lo lejos, sosteniendo un letrero que dice PRONTO. Nota: Las configuraciones de validación no son necesariamente las mismas que las configuraciones de entrenamiento.

Como usar

### Configuraciones de Validación
- CFG: 9.2
- CFG Rescale: 0.7
- Pasos: 30
- Sampler: euler
- Seed: 420420420
- Resoluciones: 1024x1024, 1152x960, 896x1152

El codificador de texto no fue entrenado. Puede reutilizar el codificador de texto del modelo base para la inferencia.

### Configuraciones de Entrenamiento
- Épocas de entrenamiento: 4
- Pasos de entrenamiento: 48700
- Tasa de aprendizaje: 4e-07
- Tamaño efectivo de lote: 32
- Tamaño de micro-lote: 4
- Pasos de acumulación de gradiente: 8

- Tipo de predicción: v_prediction
- Betas re-escalados con SNR cero: True
- Optimizador: AdamW, bf16 estocástico
- Precisión: BF16 puro
- Xformers: Habilitado

Funcionalidades

Modelo de difusión de texto a imagen
Usa safetensors
Licencia: creativeml-openrail-m
Afinado a partir del modelo base stabilityai/stable-diffusion-2-1

Casos de uso

Generación de imágenes cinematográficas
Creación de carteles de películas
Representaciones de escenas artísticas
Exploración de diferentes estilos visuales