terminus-xl-velocity-training
bghira
Texto a imagen
Este es un ajuste fino completo derivado de ptx0/terminus-xl-velocity-v2. Las configuraciones de validación principales utilizadas durante el entrenamiento incluirían mensajes de validación específicos.
Como usar
import torch
from diffusers import DiffusionPipeline
model_id = "terminus-xl-velocity-training"
prompt = "un lindo personaje de anime llamado tostada sosteniendo un cartel que dice 'PRONTO', sentado junto a un cuadrado rojo a su izquierda y una esfera transparente a su derecha"
negative_prompt = "malformado, repugnante, sobreexpuesto, desteñido"
pipeline = DiffusionPipeline.from_pretrained(model_id)
pipeline.to('cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu')
image = pipeline(
prompt=prompt,
negative_prompt='',
num_inference_steps=30,
generator=torch.Generator(device='cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu').manual_seed(1641421826),
width=1152,
height=768,
guidance_scale=7.5,
guidance_rescale=0.7,
).images[0]
image.save("output.png", format="PNG")
Funcionalidades
- Finetune completo
- Configuraciones de validación explícitas
- Túnel de difusión de imagen a texto
- Optimización AdamW con precisión BF16
- Autoescalado SNR cero
Casos de uso
- Generar imágenes de personajes de anime con configuraciones específicas
- Crear ambientes de planetas alienígenas y mundos de fantasía
- Representar ciudades futuristas y escenarios de batalla épicos
- Fabricar ilustraciones para cómics y novelas gráficas
- Desarrollar contenido gráfico para videojuegos y películas