diffusers/FLUX.1-dev-bnb-4bit

diffusers
Texto a imagen

Checkpoint cuantizado en 4 bits de FLUX.1-dev para generación de imágenes a partir de texto con Diffusers. Usa BitsAndBytes/NF4 para reducir el coste de memoria frente al modelo BF16 original, manteniendo el flujo de uso de FluxPipeline.

Como usar

Instalación básica con Diffusers:

pip install -U diffusers transformers accelerate
import torch
from diffusers import DiffusionPipeline

# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained("diffusers/FLUX.1-dev-bnb-4bit", dtype=torch.bfloat16, device_map="cuda")

prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]

Uso recomendado del checkpoint cuantizado:

pip install -U diffusers
pip install -U bitsandbytes
from diffusers import FluxPipeline

pipe = FluxPipeline.from_pretrained(
    "diffusers/FLUX.1-dev-bnb-4bit",
    torch_dtype=torch.bfloat16
)
pipe.to("cuda")

prompt = "Baroque style, a lavish palace interior with ornate gilded ceilings, intricate tapestries, and dramatic lighting over a grand staircase."

pipe_kwargs = {
    "prompt": prompt,
    "height": 1024,
    "width": 1024,
    "guidance_scale": 3.5,
    "num_inference_steps": 50,
    "max_sequence_length": 512,
}

image = pipe(
    **pipe_kwargs,
    generator=torch.manual_seed(0),
).images[0]
image.save("flux.png")

Funcionalidades

Generación texto-a-imagen basada en FLUX.1-dev.
Cuantización BnB de 4 bits con tipo NF4.
Compatible con Diffusers y Safetensors.
Pensado para ejecución local en GPU CUDA con menor uso de VRAM.
Incluye configuración de cuantización para transformer y text_encoder_2.
No está desplegado actualmente en proveedores de inferencia de Hugging Face.

Casos de uso

Crear imágenes detalladas desde prompts de texto en entornos locales.
Probar FLUX.1-dev con menor consumo de memoria que una carga BF16 completa.
Comparar resultados entre checkpoints BF16 y versiones cuantizadas.
Generar imágenes de alta resolución, por ejemplo 1024x1024, usando FluxPipeline.