lightx2v/Qwen-Image-Lightning

lightx2v
Texto a imagen

Modelo LoRA destilado para generación de imágenes a partir de texto basado en Qwen/Qwen-Image, optimizado para inferencia rápida en pocos pasos con Diffusers.

Como usar

Consulta el repositorio de GitHub de Qwen-Image-Lightning para más detalles de uso. Con Diffusers, se indica instalar la versión principal del paquete y cargar el LoRA sobre Qwen/Qwen-Image.

from diffusers import DiffusionPipeline, FlowMatchEulerDiscreteScheduler
import torch
import math

# From https://github.com/ModelTC/Qwen-Image-Lightning/blob/342260e8f5468d2f24d084ce04f55e101007118b/generate_with_diffusers.py#L82C9-L97C10
scheduler_config = {
    "base_image_seq_len": 256,
    "base_shift": math.log(3), # We use shift=3 in distillation
    "invert_sigmas": False,
    "max_image_seq_len": 8192,
    "max_shift": math.log(3), # We use shift=3 in distillation
    "num_train_timesteps": 1000,
    "shift": 1.0,
    "shift_terminal": None, # set shift_terminal to None
    "stochastic_sampling": False,
    "time_shift_type": "exponential",
    "use_beta_sigmas": False,
    "use_dynamic_shifting": True,
    "use_exponential_sigmas": False,
    "use_karras_sigmas": False,
}

scheduler = FlowMatchEulerDiscreteScheduler.from_config(scheduler_config)
pipe = DiffusionPipeline.from_pretrained(
    "Qwen/Qwen-Image",
    scheduler=scheduler,
    torch_dtype=torch.bfloat16
).to("cuda")
pipe.load_lora_weights(
    "lightx2v/Qwen-Image-Lightning",
    weight_name="Qwen-Image-Lightning-8steps-V1.0.safetensors"
)

prompt = "a tiny astronaut hatching from an egg on the moon, Ultra HD, 4K, cinematic composition."
negative_prompt = " "
image = pipe(
    prompt=prompt,
    negative_prompt=negative_prompt,
    width=1024,
    height=1024,
    num_inference_steps=8,
    true_cfg_scale=1.0,
    generator=torch.manual_seed(0),
).images[0]
image.save("qwen_fewsteps.png")

Funcionalidades

Generación de imágenes desde texto con enfoque en velocidad usando 8 pasos de inferencia.
Adaptador LoRA sobre el modelo base `Qwen/Qwen-Image`.
Compatible con `DiffusionPipeline` de Diffusers y scheduler `FlowMatchEulerDiscreteScheduler`.
Orientado a prompts en inglés y chino.
Licencia `apache-2.0`.

Casos de uso

Generación rápida de ilustraciones text-to-image con calidad alta y pocos pasos.
Prototipado visual acelerado sobre el ecosistema Qwen-Image.
Despliegues creativos en Spaces o pipelines Diffusers que priorizan latencia reducida.
Experimentación con LoRAs de imagen compatibles con `Qwen/Qwen-Image`.