briannlongzhao/textual_inversion

briannlongzhao

Texto a imagen

Pesos de adaptación de inversión textual para generación de imágenes con Stable Diffusion 2.1. El modelo añade un embedding entrenado mediante textual inversion que se carga sobre el modelo base `stabilityai/stable-diffusion-2-1` para ajustar la generación text-to-image.

Como usar

Instalación y uso con Diffusers:
pip install -U diffusers transformers accelerate

import torch
from diffusers import DiffusionPipeline

# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained(
    "stabilityai/stable-diffusion-2-1",
    dtype=torch.bfloat16,
    device_map="cuda"
)
pipe.load_textual_inversion("briannlongzhao/textual_inversion")

Funcionalidades

Adaptador de textual inversion para `stabilityai/stable-diffusion-2-1`.
Compatible con Diffusers y `StableDiffusionPipeline`.
Distribuido en formato Safetensors.
Orientado a generación de imágenes a partir de texto mediante fine-tuning ligero.
Incluye métricas de entrenamiento en TensorBoard.

Casos de uso

Generar imágenes con Stable Diffusion 2.1 usando un concepto o estilo aprendido mediante textual inversion.
Probar pesos de adaptación ligeros sin volver a entrenar el modelo base completo.
Integrar un embedding personalizado en flujos locales de Diffusers, Draw Things o DiffusionBee.