nunchaku-ai/nunchaku-flux.1-krea-dev

nunchaku-ai
Texto a imagen

Versión cuantizada con Nunchaku de FLUX.1-Krea-dev para generación de imágenes a partir de texto. Está pensada para inferencia más eficiente con pérdida mínima de rendimiento, usando cuantización SVDQuant sobre un modelo FLUX.1-Krea-dev.

Como usar

Uso con Diffusers: consultar flux.1-krea-dev.py y reemplazar los archivos .safetensors por los de este repositorio.

Uso con ComfyUI: consultar nunchaku-flux.1-dev.json y reemplazar los archivos .safetensors por los de este repositorio.

Cita recomendada:

@inproceedings{
  li2024svdquant,
  title={SVDQuant: Absorbing Outliers by Low-Rank Components for 4-Bit Diffusion Models},
  author={Li*, Muyang and Lin*, Yujun and Zhang*, Zhekai and Cai, Tianle and Li, Xiuyu and Guo, Junxian and Xie, Enze and Meng, Chenlin and Zhu, Jun-Yan and Han, Song},
  booktitle={The Thirteenth International Conference on Learning Representations},
  year={2025}
}

Funcionalidades

Modelo text-to-image basado en difusión para generar imágenes de alta calidad desde prompts de texto.
Incluye pesos SVDQuant INT4 para GPUs anteriores a Blackwell: `svdq-int4_r32-flux.1-krea-dev.safetensors`.
Incluye pesos SVDQuant NVFP4 para GPUs Blackwell, serie 50: `svdq-fp4_r32-flux.1-krea-dev.safetensors`.
Usa `nunchaku` como motor de inferencia y `deepcompressor` como biblioteca de cuantización.
Cuantizado desde `FLUX.1-Krea-dev`, con base en la familia `FLUX.1-dev`.
Licencia no comercial `flux-1-krea-dev-non-commercial-license`.
Relacionado con el paper SVDQuant presentado en ICLR 2025.

Casos de uso

Generación de imágenes desde texto con FLUX.1-Krea-dev usando inferencia cuantizada.
Ejecución más eficiente de modelos FLUX en hardware compatible con Nunchaku.
Uso de pesos INT4 en GPUs anteriores a la serie 50.
Uso de pesos NVFP4 en GPUs Blackwell de la serie 50.
Integración en pipelines Diffusers o flujos ComfyUI que ya usen modelos FLUX.