segmind/small-sd

segmind

Texto a imagen

Modelo de texto a imagen basado en Diffusers y Stable Diffusion, destilado a partir de SG161222/Realistic_Vision_V4.0 sobre un subconjunto de recastai/LAION-art-EN-improved-captions para generar imágenes a 512x512 con una arquitectura comprimida.

Como usar

Uso con Diffusers en Python:
from diffusers import DiffusionPipeline
import torch

pipeline = DiffusionPipeline.from_pretrained("segmind/small-sd", torch_dtype=torch.float16)
prompt = "Portrait of a pretty girl"
image = pipeline(prompt).images[0]
image.save("my_image.png")

Funcionalidades

Generación de imágenes a partir de prompts de texto
Pipeline destilado desde SG161222/Realistic_Vision_V4.0
Implementado con StableDiffusionPipeline en Diffusers
Entrenado con resolución de 512 y precisión mixta fp16
Orientado a compresión arquitectónica de modelos de difusión texto a imagen

Casos de uso

Crear retratos generados por IA a partir de descripciones textuales
Probar pipelines ligeros de difusión para texto a imagen
Experimentar con modelos comprimidos derivados de Realistic Vision
Integrar generación de imágenes en aplicaciones Python con Diffusers