terminus-xl-velocity-training

bghira
Texto a imagen

Este es un ajuste fino completo derivado de ptx0/terminus-xl-velocity-v2. Las configuraciones de validación principales utilizadas durante el entrenamiento incluirían mensajes de validación específicos.

Como usar

import torch
from diffusers import DiffusionPipeline

model_id = "terminus-xl-velocity-training"
prompt = "un lindo personaje de anime llamado tostada sosteniendo un cartel que dice 'PRONTO', sentado junto a un cuadrado rojo a su izquierda y una esfera transparente a su derecha"
negative_prompt = "malformado, repugnante, sobreexpuesto, desteñido"

pipeline = DiffusionPipeline.from_pretrained(model_id)
pipeline.to('cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu')
image = pipeline(
prompt=prompt,
negative_prompt='',
num_inference_steps=30,
generator=torch.Generator(device='cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu').manual_seed(1641421826),
width=1152,
height=768,
guidance_scale=7.5,
guidance_rescale=0.7,
).images[0]
image.save("output.png", format="PNG")

Funcionalidades

Finetune completo
Configuraciones de validación explícitas
Túnel de difusión de imagen a texto
Optimización AdamW con precisión BF16
Autoescalado SNR cero

Casos de uso

Generar imágenes de personajes de anime con configuraciones específicas
Crear ambientes de planetas alienígenas y mundos de fantasía
Representar ciudades futuristas y escenarios de batalla épicos
Fabricar ilustraciones para cómics y novelas gráficas
Desarrollar contenido gráfico para videojuegos y películas