segmind/small-sd
segmind
Texto a imagen
Modelo de texto a imagen basado en Diffusers y Stable Diffusion, destilado a partir de SG161222/Realistic_Vision_V4.0 sobre un subconjunto de recastai/LAION-art-EN-improved-captions para generar imágenes a 512x512 con una arquitectura comprimida.
Como usar
Uso con Diffusers en Python:
from diffusers import DiffusionPipeline
import torch
pipeline = DiffusionPipeline.from_pretrained("segmind/small-sd", torch_dtype=torch.float16)
prompt = "Portrait of a pretty girl"
image = pipeline(prompt).images[0]
image.save("my_image.png")
Funcionalidades
- Generación de imágenes a partir de prompts de texto
- Pipeline destilado desde SG161222/Realistic_Vision_V4.0
- Implementado con StableDiffusionPipeline en Diffusers
- Entrenado con resolución de 512 y precisión mixta fp16
- Orientado a compresión arquitectónica de modelos de difusión texto a imagen
Casos de uso
- Crear retratos generados por IA a partir de descripciones textuales
- Probar pipelines ligeros de difusión para texto a imagen
- Experimentar con modelos comprimidos derivados de Realistic Vision
- Integrar generación de imágenes en aplicaciones Python con Diffusers