lambda/miniSD-diffusers

lambda

Texto a imagen

Modelo de texto a imagen basado en Diffusers y StableDiffusionPipeline. Es una versión mini afinada a partir del checkpoint Stable Diffusion 1.4, entrenada en LAION Improved Aesthetics 6plus para generar imágenes a partir de prompts de texto, típicamente en resoluciones pequeñas como 256x256.

Como usar

from diffusers import StableDiffusionPipeline

pipe = StableDiffusionPipeline.from_pretrained("lambdalabs/miniSD-diffusers")
pipe = pipe.to("cuda")

prompt = "a photograph of an wrinkly old man laughing"
image = pipe(prompt, width=256, height=256).images[0]
image.save('test.jpg')

Funcionalidades

Generación de imágenes desde texto con StableDiffusionPipeline.
Compatible con la biblioteca Diffusers de Hugging Face.
Afinado desde Stable Diffusion 1.4.
Entrenamiento en dos fases: primero solo capas de atención del U-Net y después el U-Net completo.
Licencia CreativeML OpenRAIL-M, con uso comercial permitido bajo restricciones de uso responsable.

Casos de uso

Crear imágenes a partir de descripciones textuales cortas.
Probar flujos de generación de imágenes con Diffusers en GPU.
Experimentar con una variante compacta afinada desde Stable Diffusion 1.4.
Generar prototipos visuales o imágenes de baja resolución para pruebas.