markury/spirited-away-flux

markury
Texto a imagen

Adaptador LyCORIS/LoRA de texto a imagen para FLUX.1-dev, entrenado para generar escenas con estética inspirada en la película animada Spirited Away. El modelo usa como base black-forest-labs/FLUX.1-dev y no entrena el codificador de texto, por lo que se reutiliza el text encoder del modelo base durante la inferencia.

Como usar

Instalación y uso básico con Diffusers:

pip install -U diffusers transformers accelerate
import torch
from diffusers import DiffusionPipeline

# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained("black-forest-labs/FLUX.1-dev", dtype=torch.bfloat16, device_map="cuda")
pipe.load_lora_weights("markury/spirited-away-flux")

prompt = "unconditional (blank prompt)"
image = pipe(prompt).images[0]

Ejemplo de inferencia con LyCORIS:

import torch
from diffusers import DiffusionPipeline
from lycoris import create_lycoris_from_weights

model_id = 'black-forest-labs/FLUX.1-dev'
adapter_id = 'pytorch_lora_weights.safetensors' # you will have to download this manually
lora_scale = 1.0
wrapper, _ = create_lycoris_from_weights(lora_scale, adapter_id, pipeline.transformer)
wrapper.merge_to()

prompt = "A scene from the animated Studio Ghibli movie Spirited Away, a girl is sitting with an orange cat in a grass field with buildings in the background"
pipeline.to('cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu')
image = pipeline(
    prompt=prompt,
    num_inference_steps=20,
    generator=torch.Generator(device='cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu').manual_seed(1641421826),
    width=1024,
    height=1024,
    guidance_scale=3.0,
).images[0]
image.save("output.png", format="PNG")

Funcionalidades

Adaptador LyCORIS derivado de black-forest-labs/FLUX.1-dev.
Especializado en generación de imágenes estilo Spirited Away mediante Diffusers/FLUX.
Entrenado durante 2 épocas y 1000 pasos con precisión bf16.
Usa configuración LyCORIS LoKr aplicada a módulos Attention y FeedForward.
Validado principalmente con resolución 1024x1024, 20 pasos, CFG 3.0 y semilla 42.
El codificador de texto no fue entrenado; se reutiliza el del modelo base.

Casos de uso

Generar imágenes de texto a imagen con una estética visual inspirada en Spirited Away.
Crear escenas animadas con campos, edificios de fondo y personajes en composición cinematográfica.
Probar adaptadores LyCORIS/LoRA sobre FLUX.1-dev en flujos de trabajo de Diffusers.
Usar como plantilla de ajuste fino para estilos visuales concretos en modelos FLUX.