shuttleai/shuttle-3-diffusion-GGUF
shuttleai
Texto a imagen
Shuttle 3 Diffusion GGUF es una variante cuantizada del modelo Shuttle 3 Diffusion para generación de imágenes a partir de texto. Está diseñado para producir imágenes detalladas y variadas en solo 4 pasos, con mejoras en calidad visual, tipografía, comprensión de prompts complejos y eficiencia de recursos. Usa Flux.1 Schnell como base, fue parcialmente desdestilado durante el entrenamiento y puede entrar en un modo de refinado al superar los 10 pasos para mejorar detalles sin cambiar la composición.
Como usar
Instalación y uso con Diffusers:
pip install -U diffusers transformers accelerate
import torch
from diffusers import DiffusionPipeline
# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained("shuttleai/shuttle-3-diffusion-GGUF", dtype=torch.bfloat16, device_map="cuda")
prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]
También se indica que puede usarse vía API a través de ShuttleAI y probarse en la web de ShuttleAI Images.
Funcionalidades
- Generación de imágenes desde prompts de texto.
- Optimizado para producir resultados en 4 pasos.
- Formato GGUF con variantes de precisión para distintos niveles de hardware: Q4_K_S, Q6_K, Q8_0 y BF16.
- Modelo de 12B parámetros con arquitectura Flux.
- Licencia Apache 2.0.
- Mejoras declaradas en detalles, colores, tipografía y seguimiento de prompts complejos.
- Modo de refinado por encima de 10 pasos para añadir detalle manteniendo la composición.
Casos de uso
- Crear imágenes detalladas desde descripciones en lenguaje natural.
- Generar arte conceptual, escenas estilizadas o imágenes creativas con pocos pasos de inferencia.
- Ejecutar generación de imágenes en hardware con distintas capacidades mediante cuantizaciones GGUF.
- Probar flujos locales con Diffusers o aplicaciones compatibles como Draw Things y DiffusionBee.