BPModel

Crosstyan
Texto a imagen

BPModel es un modelo experimental de Difusión Estable basado en ACertainty de Joseph Cheung. Entrenado con 5k imágenes de alta calidad anotadas de Sankaku Complex. Utiliza resoluciones base de 768 y 1024, y ha requerido una cantidad significativa de horas de GPU para su entrenamiento.

Como usar

El bp_1024_e10.ckpt no incluye ningún VAE y debes usar otros VAE populares en la comunidad cuando utilices AUTOMATIC1111/stable-diffusion-webui o verás el mensaje 'LaTeNt SpAcE!'. Usa bp_1024_with_vae_te.ckpt si no tienes VAE y codificador de texto, aunque el peso EMA no está incluido y es fp16. Si deseas continuar entrenando, usa bp_1024_e10_ema.ckpt que es el peso unet de ema con precisión fp32. Para un mejor rendimiento, se recomienda usar Clip skip (CLIP se detiene en las últimas capas) 2. También es recomendable activar 'Upscale latent space image when doing hires. fix' en los ajustes de AUTOMATIC1111/stable-diffusion-webui. Para usarlo:

Funcionalidades

Modelo de Difusión Estable
Entrenado con imágenes de alta calidad
Resoluciones base de 768 y 1024
Compatible con AUTOMATIC1111/stable-diffusion-webui
Incluye bp_mk3.safetensors y bp_mk5.safetensors

Casos de uso

Generación de arte en estilo anime
Creación de imágenes de alta resolución
Ajuste fino en un conjunto de datos personalizado