spooknik/Fluxmania-SVDQ
spooknik
Texto a imagen
Versión cuantizada con Nunchaku SVDQ de Fluxmania Legacy, un modelo de texto a imagen basado en Flux.1 Dev de Adel_AI. Está pensada para generar imágenes a partir de prompts de texto con variantes optimizadas para distintas generaciones de GPU.
Como usar
Instalación y uso con Diffusers:
pip install -U diffusers transformers accelerate
import torch
from diffusers import DiffusionPipeline
# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained(
"spooknik/Fluxmania-SVDQ",
dtype=torch.bfloat16,
device_map="cuda"
)
prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]
Funcionalidades
- Generación de imágenes a partir de texto con Diffusers.
- Modelo basado en Fluxmania Legacy sobre Flux.1 Dev.
- Incluye cuantización SVDQ en INT4 para GPUs anteriores a Blackwell.
- Incluye cuantización SVDQ en NVFP4 para GPUs Blackwell de la serie 50.
- Evaluación de calidad con 256 muestras del conjunto MJHQ-30K, incluyendo métricas FID, IR, LPIPS y PSNR.
- Compatible con flujos locales como ComfyUI y apps como Draw Things y DiffusionBee.
Casos de uso
- Generar imágenes artísticas o realistas a partir de descripciones textuales.
- Probar variantes cuantizadas de Fluxmania Legacy con menor demanda de memoria.
- Ejecutar inferencia local en GPUs pre-Blackwell usando INT4.
- Ejecutar inferencia optimizada en GPUs Blackwell serie 50 usando NVFP4.
- Comparar calidad visual y similitud frente al modelo BF16 no cuantizado.