Disty0/sotediffusion-wuerstchen3-decoder

Disty0

Texto a imagen

Decoder de SoteDiffusion Wuerstchen3, un ajuste fino de Würstchen V3 orientado a ilustraciones de anime. Forma parte de la colección SoteDiffusion Wuerstchen3 y está pensado para generación de imágenes de estilo anime, no para resultados realistas.

Como usar

Instalación y uso con Diffusers:
pip install -U diffusers transformers accelerate

import torch
from diffusers import DiffusionPipeline

# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained("Disty0/sotediffusion-wuerstchen3-decoder", dtype=torch.bfloat16, device_map="cuda")

prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]

La propia ficha recomienda consultar el modelo principal para el uso completo: https://huggingface.co/Disty0/sotediffusion-wuerstchen3

Funcionalidades

Modelo de texto a imagen basado en Diffusers y compatible con StableCascadeDecoderPipeline.
Distribuido en formato Safetensors bajo licencia Fair AI Public License 1.0-SD.
Entrenado con 512.000 imágenes de anime.
Optimizado como parte de un pipeline Würstchen V3/SoteDiffusion, con entrenamiento en bfloat16 y resolución de imagen configurada a 768.
No está desplegado actualmente en proveedores de inferencia de Hugging Face.

Casos de uso

Generación de ilustraciones de anime a partir de prompts de texto.
Experimentación local con pipelines Diffusers basados en Würstchen V3.
Creación de imágenes estilizadas dentro del ecosistema SoteDiffusion.
Investigación o pruebas con modelos anime entrenados sobre grandes conjuntos de imágenes.