gpustack/FLUX.1-lite-GGUF
gpustack
Texto a imagen
FLUX.1 Lite en formato GGUF es una versión cuantizada del modelo de generación texto-a-imagen Flux.1 Lite, un transformer de 8B parámetros destilado desde FLUX.1-dev. Está orientado a inferencia más eficiente: usa aproximadamente 7 GB menos de RAM y corre un 23% más rápido que el modelo original, manteniendo precisión bfloat16 en la versión base. Esta variante GGUF es experimental y está indicada como compatible solo con gpustack/llama-box v0.0.84 o superior.
Como usar
Uso recomendado con Diffusers para el modelo base Flux.1 Lite:
import torch
from diffusers import FluxPipeline
base_model_id = "Freepik/flux.1-lite-8B-alpha"
torch_dtype = torch.bfloat16
device = "cuda"
# Load the pipe
model_id = "Freepik/flux.1-lite-8B-alpha"
pipe = FluxPipeline.from_pretrained(
model_id,
torch_dtype=torch_dtype
).to(device)
# Inference
prompt = "A close-up image of a green alien with fluorescent skin in the middle of a dark purple forest"
guidance_scale = 3.5 # Keep guidance_scale at 3.5
n_steps = 28
seed = 11
with torch.inference_mode():
image = pipe(
prompt=prompt,
generator=torch.Generator(device="cpu").manual_seed(seed),
num_inference_steps=n_steps,
guidance_scale=guidance_scale,
height=1024,
width=1024,
).images[0]
image.save("output.png")
Para mejores resultados, el model card recomienda mantener guidance_scale=3.5 y usar n_steps entre 22 y 30. La variante GGUF aparece marcada como experimental y soportada únicamente por gpustack/llama-box v0.0.84 o superior.
Funcionalidades
- Generación texto-a-imagen basada en FLUX.1-dev destilado.
- Modelo Flux.1 Lite de 8B parámetros, presentado como más ligero y rápido que FLUX.1-dev.
- Distribución GGUF con cuantización basada en stable-diffusion.cpp parcheado por llama-box.
- Variantes cuantizadas FP16, Q8_0, Q4_1 y Q4_0 para componentes como CLIP ViT-L/14, T5-xxl y VAE.
- Recomendación específica de inferencia: guidance_scale de 3.5 y entre 22 y 30 pasos.
- Incluye referencia a un flujo de ComfyUI en comfy/flux.1-lite_workflow.json.
- Licencia FLUX.1 dev Non-Commercial License.
Casos de uso
- Generación de imágenes a partir de prompts de texto.
- Ejecución local de modelos FLUX en formatos cuantizados GGUF.
- Flujos de creación visual en ComfyUI usando el workflow proporcionado.
- Pruebas de inferencia texto-a-imagen con menor consumo de RAM que FLUX.1-dev.