terminus-xl-velocity-v2
bghira
Texto a imagen
Este es un modelo finamente ajustado de rango completo derivado de ptx0/terminus-xl-velocity-v1. El modelo se entrenó utilizando una configuración de validación específica con una resolución de 1024x1024, 1152x960 y 896x1152. La principal configuración de validación utilizada durante el entrenamiento fue un prompt que describe un personaje de anime lindo llamado Toast. Las configuraciones de validación y entrenamiento incluyen varios parámetros como CFG, pasos, optimizador AdamW, y una precisión BF16 pura.
Como usar
Puede reutilizar el codificador de texto del modelo base para la inferencia. A continuación se muestran las configuraciones de validación y entrenamiento:
Configuración de validación
CFG: 7.5
CFG Rescale: 0.7
Pasos: 30
Sampler: euler
Seed: 420420420
Resoluciones: 1024x1024, 1152x960, 896x1152
Configuración de entrenamiento
Épocas de entrenamiento: 0
Pasos de entrenamiento: 5400
Tasa de aprendizaje: 1e-06
Tamaño del lote efectivo: 32
Tamaño del micro-lote: 8
Pasos de acumulación de gradiente: 4
Tipo de predicción: v_prediction
Betas reescaladas con SNR cero: Verdadero
Optimizador: AdamW, bifurcación estocástica bf16
Precisión: BF16 pura
Xformers: Habilitado
Funcionalidades
- Modelo ajustado de rango completo
- Prompt principal de validación: 'un personaje de anime lindo llamado toast'
- Configuración de validación: CFG: 7.5, CFG Rescale: 0.7, Pasos: 30, Sampler: euler, Seed: 420420420
- Resoluciones: 1024x1024, 1152x960, 896x1152
- Precisión: BF16 pura
Casos de uso
- Generación de imágenes a partir de texto
- Creación de personajes de anime
- Producción de imágenes de diversas resoluciones
- Ajuste fino de modelos base
- Investigación en procesamiento de imágenes