lambda/miniSD-diffusers
lambda
Texto a imagen
Modelo de texto a imagen basado en Diffusers y StableDiffusionPipeline. Es una versión mini afinada a partir del checkpoint Stable Diffusion 1.4, entrenada en LAION Improved Aesthetics 6plus para generar imágenes a partir de prompts de texto, típicamente en resoluciones pequeñas como 256x256.
Como usar
from diffusers import StableDiffusionPipeline
pipe = StableDiffusionPipeline.from_pretrained("lambdalabs/miniSD-diffusers")
pipe = pipe.to("cuda")
prompt = "a photograph of an wrinkly old man laughing"
image = pipe(prompt, width=256, height=256).images[0]
image.save('test.jpg')
Funcionalidades
- Generación de imágenes desde texto con StableDiffusionPipeline.
- Compatible con la biblioteca Diffusers de Hugging Face.
- Afinado desde Stable Diffusion 1.4.
- Entrenamiento en dos fases: primero solo capas de atención del U-Net y después el U-Net completo.
- Licencia CreativeML OpenRAIL-M, con uso comercial permitido bajo restricciones de uso responsable.
Casos de uso
- Crear imágenes a partir de descripciones textuales cortas.
- Probar flujos de generación de imágenes con Diffusers en GPU.
- Experimentar con una variante compacta afinada desde Stable Diffusion 1.4.
- Generar prototipos visuales o imágenes de baja resolución para pruebas.