mit-han-lab/svdq-int4-flux.1-dev
mit-han-lab
Texto a imagen
Versión cuantizada INT4 de FLUX.1-dev basada en SVDQuant, orientada a generación de imágenes a partir de texto con Diffusers. El repositorio indica que fue deprecado y recomienda usar nunchaku-tech/nunchaku-flux.1-dev como reemplazo.
Como usar
Instalación y uso con Diffusers:
pip install -U diffusers transformers accelerate
import torch
from diffusers import DiffusionPipeline
# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained(
"mit-han-lab/svdq-int4-flux.1-dev",
dtype=torch.bfloat16,
device_map="cuda"
)
prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]
Funcionalidades
- Modelo de texto a imagen compatible con Diffusers.
- Cuantización de difusión a 4 bits mediante SVDQuant.
- Basado en black-forest-labs/FLUX.1-dev.
- Relacionado con el paper ICLR 2025 "SVDQuant: Absorbing Outliers by Low-Rank Components for 4-Bit Diffusion Models".
- Usa el dataset mit-han-lab/svdquant-datasets.
- Licencia FLUX.1 [dev] Non-Commercial License; uso no comercial.
Casos de uso
- Generar imágenes desde prompts de texto con una variante cuantizada de FLUX.1-dev.
- Experimentar con modelos de difusión de 4 bits para reducir requisitos de memoria o cómputo.
- Reproducir o evaluar resultados vinculados a SVDQuant en modelos de difusión.
- Usar FLUX.1-dev en flujos locales compatibles con Diffusers, sujeto a la licencia no comercial.