bdsqlsz/stable-diffusion-xl-anime-V5

bdsqlsz

Texto a imagen

Modelo de texto a imagen basado en Animagine XL 3.1 y ajustado mediante fine-tuning supervisado para generar ilustraciones de estilo anime con mejor anatomía, especialmente manos, más coloración anime y menos apariencia 3D o brillos excesivos.

Como usar

Instalación y uso con Diffusers:
pip install -U diffusers transformers accelerate

import torch
from diffusers import DiffusionPipeline

# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained("bdsqlsz/stable-diffusion-xl-anime-V5", dtype=torch.bfloat16, device_map="cuda")

prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]

La tarjeta del modelo indica que el uso debe tomar como referencia Animagine XL 3.1.

Funcionalidades

Generación de imágenes anime a partir de prompts de texto.
Basado en Stable Diffusion XL y Animagine XL 3.1.
Ajuste supervisado orientado a mejorar anatomía y manos mediante SPM.
Coloración más cercana al anime frente a salidas con aspecto 3D.
Compatible con la biblioteca Diffusers.

Casos de uso

Crear ilustraciones anime a partir de descripciones textuales.
Generar personajes, escenas y arte conceptual con estética anime.
Producir imágenes con anatomía más cuidada, especialmente manos.
Usarlo en flujos locales con Diffusers, Draw Things o DiffusionBee.