Hiruma/wai-v16

Hiruma
Texto a imagen

Modelo de texto a imagen alojado en Hugging Face, distribuido para usarse con Diffusers y la canalización Stable Diffusion XL. Está publicado en formato Safetensors y orientado a generar imágenes a partir de prompts de texto.

Como usar

Instalación y ejemplo con Diffusers:

pip install -U diffusers transformers accelerate
import torch
from diffusers import DiffusionPipeline

# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained("Hiruma/wai-v16", dtype=torch.bfloat16, device_map="cuda")

prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]

Funcionalidades

Generación de imágenes a partir de texto
Compatible con la librería Diffusers
Usa StableDiffusionXLPipeline
Pesos disponibles en formato Safetensors
Carga local con dtype bfloat16 y device_map en CUDA
No tiene model card descriptiva publicada en la página proporcionada
No aparece desplegado en proveedores de inferencia de Hugging Face

Casos de uso

Crear imágenes desde descripciones textuales
Probar generación local con Diffusers
Integrar un modelo Stable Diffusion XL en notebooks o aplicaciones locales
Experimentar con prompts visuales detallados