6DammK9/bpmodel-sd14-merge

6DammK9

Texto a imagen

Modelo de texto a imagen basado en Stable Diffusion 1.4 que fusiona la UNET de BPModel y otros modelos dentro de SD 1.4, manteniendo el codificador de texto original para conservar mayor variación en la generación. Está publicado en Hugging Face en formato Diffusers/Safetensors bajo licencia CreativeML OpenRAIL-M.

Como usar

Instalación y uso con Diffusers:
pip install -U diffusers transformers accelerate

import torch
from diffusers import DiffusionPipeline

# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained("6DammK9/bpmodel-sd14-merge", dtype=torch.bfloat16, device_map="cuda")

prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]

También puede usarse desde notebooks como Google Colab o Kaggle y aplicaciones locales compatibles con Stable Diffusion como Draw Things y DiffusionBee.

Funcionalidades

Generación de imágenes a partir de prompts de texto.
Basado en Stable Diffusion 1.4 con arquitectura Diffusers.
Fusión centrada en la UNET de BPModel, descartando componentes como Text Encoder y VAE del modelo original fusionado.
Incluye pesos en Safetensors.
Compatible con flujos locales mediante Diffusers, Google Colab, Kaggle, Draw Things y DiffusionBee.
Lista de merges preparados con modelos como VBP, CBP, DreamShaperV8, CoffeeWithLiquor, BreakDomain, MajicMix, BPModel, GuoFeng3 y YiffyMix.
Incluye ejemplos de parámetros de generación, prompts negativos, CFG scale, sampler Euler, clip skip y VAE usado.

Casos de uso

Crear imágenes generadas por texto con estética derivada de BPModel y otros merges sobre SD 1.4.
Experimentar con fusiones de UNET manteniendo el Text Encoder original de Stable Diffusion 1.4.
Probar variaciones visuales entre modelos fusionados como DreamShaperV8, CoffeeWithLiquor, MajicMix, GuoFeng3 o YiffyMix.
Generar arte de personajes, escenas estilizadas o composiciones detalladas usando prompts positivos y negativos avanzados.