markury/spirited-away-flux
markury
Texto a imagen
Adaptador LyCORIS/LoRA de texto a imagen para FLUX.1-dev, entrenado para generar escenas con estética inspirada en la película animada Spirited Away. El modelo usa como base black-forest-labs/FLUX.1-dev y no entrena el codificador de texto, por lo que se reutiliza el text encoder del modelo base durante la inferencia.
Como usar
Instalación y uso básico con Diffusers:
pip install -U diffusers transformers accelerate
import torch
from diffusers import DiffusionPipeline
# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained("black-forest-labs/FLUX.1-dev", dtype=torch.bfloat16, device_map="cuda")
pipe.load_lora_weights("markury/spirited-away-flux")
prompt = "unconditional (blank prompt)"
image = pipe(prompt).images[0]
Ejemplo de inferencia con LyCORIS:
import torch
from diffusers import DiffusionPipeline
from lycoris import create_lycoris_from_weights
model_id = 'black-forest-labs/FLUX.1-dev'
adapter_id = 'pytorch_lora_weights.safetensors' # you will have to download this manually
lora_scale = 1.0
wrapper, _ = create_lycoris_from_weights(lora_scale, adapter_id, pipeline.transformer)
wrapper.merge_to()
prompt = "A scene from the animated Studio Ghibli movie Spirited Away, a girl is sitting with an orange cat in a grass field with buildings in the background"
pipeline.to('cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu')
image = pipeline(
prompt=prompt,
num_inference_steps=20,
generator=torch.Generator(device='cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu').manual_seed(1641421826),
width=1024,
height=1024,
guidance_scale=3.0,
).images[0]
image.save("output.png", format="PNG")
Funcionalidades
- Adaptador LyCORIS derivado de black-forest-labs/FLUX.1-dev.
- Especializado en generación de imágenes estilo Spirited Away mediante Diffusers/FLUX.
- Entrenado durante 2 épocas y 1000 pasos con precisión bf16.
- Usa configuración LyCORIS LoKr aplicada a módulos Attention y FeedForward.
- Validado principalmente con resolución 1024x1024, 20 pasos, CFG 3.0 y semilla 42.
- El codificador de texto no fue entrenado; se reutiliza el del modelo base.
Casos de uso
- Generar imágenes de texto a imagen con una estética visual inspirada en Spirited Away.
- Crear escenas animadas con campos, edificios de fondo y personajes en composición cinematográfica.
- Probar adaptadores LyCORIS/LoRA sobre FLUX.1-dev en flujos de trabajo de Diffusers.
- Usar como plantilla de ajuste fino para estilos visuales concretos en modelos FLUX.