diffusers/FLUX.1-dev-bnb-4bit
diffusers
Texto a imagen
Checkpoint cuantizado en 4 bits de FLUX.1-dev para generación de imágenes a partir de texto con Diffusers. Usa BitsAndBytes/NF4 para reducir el coste de memoria frente al modelo BF16 original, manteniendo el flujo de uso de FluxPipeline.
Como usar
Instalación básica con Diffusers:
pip install -U diffusers transformers accelerate
import torch
from diffusers import DiffusionPipeline
# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained("diffusers/FLUX.1-dev-bnb-4bit", dtype=torch.bfloat16, device_map="cuda")
prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]
Uso recomendado del checkpoint cuantizado:
pip install -U diffusers
pip install -U bitsandbytes
from diffusers import FluxPipeline
pipe = FluxPipeline.from_pretrained(
"diffusers/FLUX.1-dev-bnb-4bit",
torch_dtype=torch.bfloat16
)
pipe.to("cuda")
prompt = "Baroque style, a lavish palace interior with ornate gilded ceilings, intricate tapestries, and dramatic lighting over a grand staircase."
pipe_kwargs = {
"prompt": prompt,
"height": 1024,
"width": 1024,
"guidance_scale": 3.5,
"num_inference_steps": 50,
"max_sequence_length": 512,
}
image = pipe(
**pipe_kwargs,
generator=torch.manual_seed(0),
).images[0]
image.save("flux.png")
Funcionalidades
- Generación texto-a-imagen basada en FLUX.1-dev.
- Cuantización BnB de 4 bits con tipo NF4.
- Compatible con Diffusers y Safetensors.
- Pensado para ejecución local en GPU CUDA con menor uso de VRAM.
- Incluye configuración de cuantización para transformer y text_encoder_2.
- No está desplegado actualmente en proveedores de inferencia de Hugging Face.
Casos de uso
- Crear imágenes detalladas desde prompts de texto en entornos locales.
- Probar FLUX.1-dev con menor consumo de memoria que una carga BF16 completa.
- Comparar resultados entre checkpoints BF16 y versiones cuantizadas.
- Generar imágenes de alta resolución, por ejemplo 1024x1024, usando FluxPipeline.