terminus-xl-velocity-v2

bghira

Texto a imagen

Este es un modelo finamente ajustado de rango completo derivado de ptx0/terminus-xl-velocity-v1. El modelo se entrenó utilizando una configuración de validación específica con una resolución de 1024x1024, 1152x960 y 896x1152. La principal configuración de validación utilizada durante el entrenamiento fue un prompt que describe un personaje de anime lindo llamado Toast. Las configuraciones de validación y entrenamiento incluyen varios parámetros como CFG, pasos, optimizador AdamW, y una precisión BF16 pura.

Como usar

Puede reutilizar el codificador de texto del modelo base para la inferencia. A continuación se muestran las configuraciones de validación y entrenamiento:
Configuración de validación
CFG: 7.5
CFG Rescale: 0.7
Pasos: 30
Sampler: euler
Seed: 420420420
Resoluciones: 1024x1024, 1152x960, 896x1152

Configuración de entrenamiento
Épocas de entrenamiento: 0
Pasos de entrenamiento: 5400
Tasa de aprendizaje: 1e-06
Tamaño del lote efectivo: 32
Tamaño del micro-lote: 8
Pasos de acumulación de gradiente: 4
Tipo de predicción: v_prediction
Betas reescaladas con SNR cero: Verdadero
Optimizador: AdamW, bifurcación estocástica bf16
Precisión: BF16 pura
Xformers: Habilitado

Funcionalidades

Modelo ajustado de rango completo
Prompt principal de validación: 'un personaje de anime lindo llamado toast'
Configuración de validación: CFG: 7.5, CFG Rescale: 0.7, Pasos: 30, Sampler: euler, Seed: 420420420
Resoluciones: 1024x1024, 1152x960, 896x1152
Precisión: BF16 pura

Casos de uso

Generación de imágenes a partir de texto
Creación de personajes de anime
Producción de imágenes de diversas resoluciones
Ajuste fino de modelos base
Investigación en procesamiento de imágenes