Disty0/sotediffusion-wuerstchen3-decoder
Disty0
Texto a imagen
Decoder de SoteDiffusion Wuerstchen3, un ajuste fino de Würstchen V3 orientado a ilustraciones de anime. Forma parte de la colección SoteDiffusion Wuerstchen3 y está pensado para generación de imágenes de estilo anime, no para resultados realistas.
Como usar
Instalación y uso con Diffusers:
pip install -U diffusers transformers accelerate
import torch
from diffusers import DiffusionPipeline
# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained("Disty0/sotediffusion-wuerstchen3-decoder", dtype=torch.bfloat16, device_map="cuda")
prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]
La propia ficha recomienda consultar el modelo principal para el uso completo: https://huggingface.co/Disty0/sotediffusion-wuerstchen3
Funcionalidades
- Modelo de texto a imagen basado en Diffusers y compatible con StableCascadeDecoderPipeline.
- Distribuido en formato Safetensors bajo licencia Fair AI Public License 1.0-SD.
- Entrenado con 512.000 imágenes de anime.
- Optimizado como parte de un pipeline Würstchen V3/SoteDiffusion, con entrenamiento en bfloat16 y resolución de imagen configurada a 768.
- No está desplegado actualmente en proveedores de inferencia de Hugging Face.
Casos de uso
- Generación de ilustraciones de anime a partir de prompts de texto.
- Experimentación local con pipelines Diffusers basados en Würstchen V3.
- Creación de imágenes estilizadas dentro del ecosistema SoteDiffusion.
- Investigación o pruebas con modelos anime entrenados sobre grandes conjuntos de imágenes.