Pixel Art XL

nerijs
Texto a imagen

Pixel Art XL es un modelo Text-to-Image que permite generar imágenes de pixel art perfectas. Requiere una VAE fija para evitar artefactos y puede escalarse hasta 8 veces para obtener mejores resultados.

Como usar

Para utilizar el modelo, sigue el siguiente código en Python:

from diffusers import DiffusionPipeline, LCMScheduler
import torch

model_id = "stabilityai/stable-diffusion-xl-base-1.0"
lcm_lora_id = "latent-consistency/lcm-lora-sdxl"
pipe = DiffusionPipeline.from_pretrained(model_id, variant="fp16")
pipe.scheduler = LCMScheduler.from_config(pipe.scheduler.config)

pipe.load_lora_weights(lcm_lora_id, adapter_name="lora")
pipe.load_lora_weights("./pixel-art-xl.safetensors", adapter_name="pixel")

pipe.set_adapters(["lora", "pixel"], adapter_weights=[1.0, 1.2])
pipe.to(device="cuda", dtype=torch.float16)

prompt = "pixel, un corgi lindo"
negative_prompt = "render 3d, realista"

num_images = 9

for i in range(num_images):
    img = pipe(
        prompt=prompt,
        negative_prompt=negative_prompt,
        num_inference_steps=8,
        guidance_scale=1.5,
    ).images[0]
    
    img.save(f"lcm_lora_{i}.png")

Consejos adicionales:

  • No usar refinador
  • Funciona bien solo con un codificador de texto
  • No requiere un prompt de estilo
  • No requiere una palabra clave de activación
  • Funciona bien con imágenes isométricas y no isométricas
  • Compatible con versiones 0.9 y 1.0

Funcionalidades

Escalado de imágenes 8 veces para obtener resultados precisos en pixel art
Uso de una VAE fija para evitar artefactos
Compatible con LCM Lora
Funciona con pasos de inferencia ajustados y escala de guía específica
No requiere refinador
Funciona perfectamente con un solo codificador de texto
No requiere un prompt de estilo específico
Compatible con imágenes isométricas y no isométricas
Funciona con versiones 0.9 y 1.0

Casos de uso

Generación de arte de píxeles perfecto a partir de descripciones textuales
Creación de obras de arte isométricas y no isométricas
Desarrollo de contenido visual para videojuegos o aplicaciones retro
Optimización de rendimiento en la generación de imágenes