6DammK9/bpmodel-sd14-merge
6DammK9
Texto a imagen
Modelo de texto a imagen basado en Stable Diffusion 1.4 que fusiona la UNET de BPModel y otros modelos dentro de SD 1.4, manteniendo el codificador de texto original para conservar mayor variación en la generación. Está publicado en Hugging Face en formato Diffusers/Safetensors bajo licencia CreativeML OpenRAIL-M.
Como usar
Instalación y uso con Diffusers:
pip install -U diffusers transformers accelerate
import torch
from diffusers import DiffusionPipeline
# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained("6DammK9/bpmodel-sd14-merge", dtype=torch.bfloat16, device_map="cuda")
prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]
También puede usarse desde notebooks como Google Colab o Kaggle y aplicaciones locales compatibles con Stable Diffusion como Draw Things y DiffusionBee.
Funcionalidades
- Generación de imágenes a partir de prompts de texto.
- Basado en Stable Diffusion 1.4 con arquitectura Diffusers.
- Fusión centrada en la UNET de BPModel, descartando componentes como Text Encoder y VAE del modelo original fusionado.
- Incluye pesos en Safetensors.
- Compatible con flujos locales mediante Diffusers, Google Colab, Kaggle, Draw Things y DiffusionBee.
- Lista de merges preparados con modelos como VBP, CBP, DreamShaperV8, CoffeeWithLiquor, BreakDomain, MajicMix, BPModel, GuoFeng3 y YiffyMix.
- Incluye ejemplos de parámetros de generación, prompts negativos, CFG scale, sampler Euler, clip skip y VAE usado.
Casos de uso
- Crear imágenes generadas por texto con estética derivada de BPModel y otros merges sobre SD 1.4.
- Experimentar con fusiones de UNET manteniendo el Text Encoder original de Stable Diffusion 1.4.
- Probar variaciones visuales entre modelos fusionados como DreamShaperV8, CoffeeWithLiquor, MajicMix, GuoFeng3 o YiffyMix.
- Generar arte de personajes, escenas estilizadas o composiciones detalladas usando prompts positivos y negativos avanzados.