second-state/FLUX.1-dev-GGUF

second-state
Texto a imagen

Versión cuantizada en formato GGUF de black-forest-labs/FLUX.1-dev, preparada para generación de imágenes texto-a-imagen y compatible con LlamaEdge/sd-api-server. Incluye pesos FLUX.1-dev y componentes auxiliares como VAE, CLIP-L y T5-XXL en varias cuantizaciones para reducir tamaño y facilitar ejecución local.

Como usar

Ejecutar como servicio LlamaEdge con sd-api-server:

wasmedge --dir.:. sd-api-server.wasm \
  --model-name flux1-dev \
  --diffusion-model flux1-dev-Q4_0.gguf \
  --vae ae.safetensors \
  --clip-l clip_l.safetensors \
  --t5xxl t5xxl-Q8_0.gguf

Ejecutar con LoRA, asumiendo que el modelo LoRA está en el directorio lora-models:

wasmedge --dir.:. \
  --dir lora-models:lora-models \
  sd-api-server.wasm \
  --model-name flux1-dev \
  --diffusion-model flux1-dev-Q4_0.gguf \
  --vae ae.safetensors \
  --clip-l clip_l.safetensors \
  --t5xxl t5xxl-Q8_0.gguf \
  --lora-model-dir lora-models

Funcionalidades

Modelo texto-a-imagen basado en FLUX.1-dev.
Distribuido como cuantizaciones GGUF compatibles con stable-diffusion.cpp.
Incluye variantes de 2, 3, 4, 5 y 8 bits para distintos equilibrios entre tamaño y calidad.
Soporta ejecución con sd-api-server como servicio LlamaEdge mediante WasmEdge.
Permite usar modelos LoRA desde un directorio local.
Incluye archivos auxiliares como ae.safetensors, clip_l.safetensors/clip_l-Q8_0.gguf y t5xxl en varias cuantizaciones.

Casos de uso

Generación local de imágenes a partir de texto con FLUX.1-dev.
Despliegue de FLUX.1-dev en entornos LlamaEdge/WasmEdge.
Pruebas con distintas cuantizaciones GGUF para ajustar consumo de memoria, tamaño de descarga y rendimiento.
Inferencia texto-a-imagen con LoRA para adaptar el estilo o el comportamiento visual del modelo.