shuttleai/shuttle-3-diffusion-GGUF

shuttleai
Texto a imagen

Shuttle 3 Diffusion GGUF es una variante cuantizada del modelo Shuttle 3 Diffusion para generación de imágenes a partir de texto. Está diseñado para producir imágenes detalladas y variadas en solo 4 pasos, con mejoras en calidad visual, tipografía, comprensión de prompts complejos y eficiencia de recursos. Usa Flux.1 Schnell como base, fue parcialmente desdestilado durante el entrenamiento y puede entrar en un modo de refinado al superar los 10 pasos para mejorar detalles sin cambiar la composición.

Como usar

Instalación y uso con Diffusers:

pip install -U diffusers transformers accelerate
import torch
from diffusers import DiffusionPipeline

# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained("shuttleai/shuttle-3-diffusion-GGUF", dtype=torch.bfloat16, device_map="cuda")

prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]

También se indica que puede usarse vía API a través de ShuttleAI y probarse en la web de ShuttleAI Images.

Funcionalidades

Generación de imágenes desde prompts de texto.
Optimizado para producir resultados en 4 pasos.
Formato GGUF con variantes de precisión para distintos niveles de hardware: Q4_K_S, Q6_K, Q8_0 y BF16.
Modelo de 12B parámetros con arquitectura Flux.
Licencia Apache 2.0.
Mejoras declaradas en detalles, colores, tipografía y seguimiento de prompts complejos.
Modo de refinado por encima de 10 pasos para añadir detalle manteniendo la composición.

Casos de uso

Crear imágenes detalladas desde descripciones en lenguaje natural.
Generar arte conceptual, escenas estilizadas o imágenes creativas con pocos pasos de inferencia.
Ejecutar generación de imágenes en hardware con distintas capacidades mediante cuantizaciones GGUF.
Probar flujos locales con Diffusers o aplicaciones compatibles como Draw Things y DiffusionBee.