Pixel Art XL
nerijs
Texto a imagen
Pixel Art XL es un modelo Text-to-Image que permite generar imágenes de pixel art perfectas. Requiere una VAE fija para evitar artefactos y puede escalarse hasta 8 veces para obtener mejores resultados.
Como usar
Para utilizar el modelo, sigue el siguiente código en Python:
from diffusers import DiffusionPipeline, LCMScheduler
import torch
model_id = "stabilityai/stable-diffusion-xl-base-1.0"
lcm_lora_id = "latent-consistency/lcm-lora-sdxl"
pipe = DiffusionPipeline.from_pretrained(model_id, variant="fp16")
pipe.scheduler = LCMScheduler.from_config(pipe.scheduler.config)
pipe.load_lora_weights(lcm_lora_id, adapter_name="lora")
pipe.load_lora_weights("./pixel-art-xl.safetensors", adapter_name="pixel")
pipe.set_adapters(["lora", "pixel"], adapter_weights=[1.0, 1.2])
pipe.to(device="cuda", dtype=torch.float16)
prompt = "pixel, un corgi lindo"
negative_prompt = "render 3d, realista"
num_images = 9
for i in range(num_images):
img = pipe(
prompt=prompt,
negative_prompt=negative_prompt,
num_inference_steps=8,
guidance_scale=1.5,
).images[0]
img.save(f"lcm_lora_{i}.png")
Consejos adicionales:
- No usar refinador
- Funciona bien solo con un codificador de texto
- No requiere un prompt de estilo
- No requiere una palabra clave de activación
- Funciona bien con imágenes isométricas y no isométricas
- Compatible con versiones 0.9 y 1.0
Funcionalidades
- Escalado de imágenes 8 veces para obtener resultados precisos en pixel art
- Uso de una VAE fija para evitar artefactos
- Compatible con LCM Lora
- Funciona con pasos de inferencia ajustados y escala de guía específica
- No requiere refinador
- Funciona perfectamente con un solo codificador de texto
- No requiere un prompt de estilo específico
- Compatible con imágenes isométricas y no isométricas
- Funciona con versiones 0.9 y 1.0
Casos de uso
- Generación de arte de píxeles perfecto a partir de descripciones textuales
- Creación de obras de arte isométricas y no isométricas
- Desarrollo de contenido visual para videojuegos o aplicaciones retro
- Optimización de rendimiento en la generación de imágenes