briannlongzhao/textual_inversion
briannlongzhao
Texto a imagen
Pesos de adaptación de inversión textual para generación de imágenes con Stable Diffusion 2.1. El modelo añade un embedding entrenado mediante textual inversion que se carga sobre el modelo base `stabilityai/stable-diffusion-2-1` para ajustar la generación text-to-image.
Como usar
Instalación y uso con Diffusers:
pip install -U diffusers transformers accelerate
import torch
from diffusers import DiffusionPipeline
# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained(
"stabilityai/stable-diffusion-2-1",
dtype=torch.bfloat16,
device_map="cuda"
)
pipe.load_textual_inversion("briannlongzhao/textual_inversion")
Funcionalidades
- Adaptador de textual inversion para `stabilityai/stable-diffusion-2-1`.
- Compatible con Diffusers y `StableDiffusionPipeline`.
- Distribuido en formato Safetensors.
- Orientado a generación de imágenes a partir de texto mediante fine-tuning ligero.
- Incluye métricas de entrenamiento en TensorBoard.
Casos de uso
- Generar imágenes con Stable Diffusion 2.1 usando un concepto o estilo aprendido mediante textual inversion.
- Probar pesos de adaptación ligeros sin volver a entrenar el modelo base completo.
- Integrar un embedding personalizado en flujos locales de Diffusers, Draw Things o DiffusionBee.