spooknik/Fluxmania-SVDQ

spooknik

Texto a imagen

Versión cuantizada con Nunchaku SVDQ de Fluxmania Legacy, un modelo de texto a imagen basado en Flux.1 Dev de Adel_AI. Está pensada para generar imágenes a partir de prompts de texto con variantes optimizadas para distintas generaciones de GPU.

Como usar

Instalación y uso con Diffusers:
pip install -U diffusers transformers accelerate

import torch
from diffusers import DiffusionPipeline

# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained(
    "spooknik/Fluxmania-SVDQ",
    dtype=torch.bfloat16,
    device_map="cuda"
)

prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]

Funcionalidades

Generación de imágenes a partir de texto con Diffusers.
Modelo basado en Fluxmania Legacy sobre Flux.1 Dev.
Incluye cuantización SVDQ en INT4 para GPUs anteriores a Blackwell.
Incluye cuantización SVDQ en NVFP4 para GPUs Blackwell de la serie 50.
Evaluación de calidad con 256 muestras del conjunto MJHQ-30K, incluyendo métricas FID, IR, LPIPS y PSNR.
Compatible con flujos locales como ComfyUI y apps como Draw Things y DiffusionBee.

Casos de uso

Generar imágenes artísticas o realistas a partir de descripciones textuales.
Probar variantes cuantizadas de Fluxmania Legacy con menor demanda de memoria.
Ejecutar inferencia local en GPUs pre-Blackwell usando INT4.
Ejecutar inferencia optimizada en GPUs Blackwell serie 50 usando NVFP4.
Comparar calidad visual y similitud frente al modelo BF16 no cuantizado.