bdsqlsz/stable-diffusion-xl-anime-V5
bdsqlsz
Texto a imagen
Modelo de texto a imagen basado en Animagine XL 3.1 y ajustado mediante fine-tuning supervisado para generar ilustraciones de estilo anime con mejor anatomía, especialmente manos, más coloración anime y menos apariencia 3D o brillos excesivos.
Como usar
Instalación y uso con Diffusers:
pip install -U diffusers transformers accelerate
import torch
from diffusers import DiffusionPipeline
# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained("bdsqlsz/stable-diffusion-xl-anime-V5", dtype=torch.bfloat16, device_map="cuda")
prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]
La tarjeta del modelo indica que el uso debe tomar como referencia Animagine XL 3.1.
Funcionalidades
- Generación de imágenes anime a partir de prompts de texto.
- Basado en Stable Diffusion XL y Animagine XL 3.1.
- Ajuste supervisado orientado a mejorar anatomía y manos mediante SPM.
- Coloración más cercana al anime frente a salidas con aspecto 3D.
- Compatible con la biblioteca Diffusers.
Casos de uso
- Crear ilustraciones anime a partir de descripciones textuales.
- Generar personajes, escenas y arte conceptual con estética anime.
- Producir imágenes con anatomía más cuidada, especialmente manos.
- Usarlo en flujos locales con Diffusers, Draw Things o DiffusionBee.