mit-han-lab/svdq-int4-flux.1-dev

mit-han-lab

Texto a imagen

Versión cuantizada INT4 de FLUX.1-dev basada en SVDQuant, orientada a generación de imágenes a partir de texto con Diffusers. El repositorio indica que fue deprecado y recomienda usar nunchaku-tech/nunchaku-flux.1-dev como reemplazo.

Como usar

Instalación y uso con Diffusers:
pip install -U diffusers transformers accelerate

import torch
from diffusers import DiffusionPipeline

# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained(
    "mit-han-lab/svdq-int4-flux.1-dev",
    dtype=torch.bfloat16,
    device_map="cuda"
)

prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]

Funcionalidades

Modelo de texto a imagen compatible con Diffusers.
Cuantización de difusión a 4 bits mediante SVDQuant.
Basado en black-forest-labs/FLUX.1-dev.
Relacionado con el paper ICLR 2025 "SVDQuant: Absorbing Outliers by Low-Rank Components for 4-Bit Diffusion Models".
Usa el dataset mit-han-lab/svdquant-datasets.
Licencia FLUX.1 [dev] Non-Commercial License; uso no comercial.

Casos de uso

Generar imágenes desde prompts de texto con una variante cuantizada de FLUX.1-dev.
Experimentar con modelos de difusión de 4 bits para reducir requisitos de memoria o cómputo.
Reproducir o evaluar resultados vinculados a SVDQuant en modelos de difusión.
Usar FLUX.1-dev en flujos locales compatibles con Diffusers, sujeto a la licencia no comercial.