Stable Diffusion Inpainting
Stable Diffusion Inpainting es un modelo latente de difusión de texto a imagen capaz de generar imágenes fotorrealistas dado cualquier entrada de texto, con la capacidad adicional de pintar las imágenes usando una máscara. El modelo Stable-Diffusion-Inpainting se inició con los pesos de Stable-Diffusion-v-1-2. Primero, 595k pasos de entrenamiento regular, luego 440k pasos de entrenamiento de inpainting a una resolución de 512x512 en 'laion-aesthetics v2 5+' y con una disminución del 10% del text-conditioning para mejorar el muestreo guía sin clasificador. Para el inpainting, el UNet tiene 5 canales de entrada adicionales (4 para la imagen codificada con máscara y 1 para la propia máscara) cuyos pesos se inicializaron a cero después de restaurar el punto de control sin inpainting. Durante el entrenamiento, generamos máscaras sintéticas y en el 25% de los casos enmascaramos todo.
Como usar
from diffusers import StableDiffusionInpaintPipeline
pipe = StableDiffusionInpaintPipeline.from_pretrained(
"runwayml/stable-diffusion-inpainting",
revision="fp16",
torch_dtype=torch.float16,
)
prompt = "Cara de un gato amarillo, alta resolución, sentado en un banco de parque"
# La imagen y la imagen de la máscara deberían ser imágenes PIL.
# La máscara es blanca para el inpainting y negra para mantener tal cual.
image = pipe(prompt=prompt, image=image, mask_image=mask_image).images[0]
image.save("./yellow_cat_on_park_bench.png")
Funcionalidades
- Generación de imágenes fotorrealistas a partir de texto
- Capacidades de inpainting usando una máscara
- Modelo basado en la difusión latente
- Codificación de texto mediante el codificador de texto CLIP ViT-L/14
- Utiliza un autoencoder con un modelo de difusión entrenado en el espacio latente del autoencoder
Casos de uso
- Propósitos de investigación
- Despliegue seguro de modelos que tienen el potencial de generar contenido dañino
- Exploración y comprensión de las limitaciones y sesgos de los modelos generativos
- Generación de obras de arte y uso en diseño y otros procesos artísticos
- Aplicaciones en herramientas educativas o creativas
- Investigación sobre modelos generativos