greentree/SDXL-olive-optimized

greentree

Texto a imagen

Versión optimizada con Microsoft Olive de Stable Diffusion XL 1.0 Base para generación de imágenes a partir de texto. Está orientada a acelerar la inferencia en Windows 11 con GPU AMD, especialmente en una RX 7900 XT, usando ONNX Runtime en lugar del formato habitual de modelos Diffusers.

Como usar

Instalación y uso con Diffusers:
pip install -U diffusers transformers accelerate

import torch
from diffusers import DiffusionPipeline

# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained("greentree/SDXL-olive-optimized", dtype=torch.bfloat16, device_map="cuda")

prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]

Funcionalidades

Generación texto a imagen basada en Stable Diffusion XL 1.0 Base.
Optimizada con Microsoft Olive para mejorar mucho la velocidad de generación.
Diseñada para ejecutarse con ONNX Runtime y DirectML.
El autor reporta una mejora de rendimiento de alrededor de 10 segundos por iteración a unas 3.80 iteraciones por segundo en una AMD RX 7900 XT con imágenes de 1024x1024.
Compatible con Diffusers mediante ORTStableDiffusionXLPipeline, pero no es intercambiable directamente con otros modelos personalizados que no usen ONNX Runtime.
Las salidas pueden contener algo de ruido y pueden requerir refinado con otro modelo.

Casos de uso

Generar imágenes de 1024x1024 desde prompts de texto con SDXL.
Acelerar flujos locales de Stable Diffusion XL en equipos Windows con GPU AMD compatible.
Probar modelos SDXL optimizados con Microsoft Olive y ONNX Runtime.
Crear imágenes artísticas o conceptuales cuando se acepta realizar refinado posterior para reducir ruido.