unsloth/FLUX.1-dev-GGUF
unsloth
Texto a imagen
Versión cuantizada en formato GGUF de FLUX.1 [dev], un transformador de flujo rectificado de 12 mil millones de parámetros para generar imágenes a partir de descripciones de texto. Está orientado a inferencia local y flujos de trabajo de investigación o creación visual, con pesos abiertos bajo la licencia no comercial de FLUX.1 [dev].
Como usar
El modelo puede usarse como punto de partida para desarrolladores y creadores que quieran construir flujos de generación de imágenes sobre FLUX.1 [dev]. La tarjeta enlaza una implementación de referencia y código de muestreo en GitHub.
También puede ejecutarse con Diffusers instalando o actualizando la librería:
pip install -U diffusers
Ejemplo con FluxPipeline:
import torch
from diffusers import FluxPipeline
pipe = FluxPipeline.from_pretrained("black-forest-labs/FLUX.1-dev", torch_dtype=torch.bfloat16)
pipe.enable_model_cpu_offload() #save some VRAM by offloading the model to CPU. Remove this if you have enough GPU power
prompt = "A cat holding a sign that says hello world"
image = pipe(
prompt,
height=1024,
width=1024,
guidance_scale=3.5,
num_inference_steps=50,
max_sequence_length=512,
generator=torch.Generator("cpu").manual_seed(0)
).images[0]
image.save("flux-dev.png")
Funcionalidades
- Generación de imágenes desde texto con arquitectura FLUX de 12B parámetros.
- Calidad de salida avanzada, situada por debajo de FLUX.1 [pro] según la tarjeta del modelo.
- Seguimiento competitivo de prompts, comparable con alternativas cerradas mencionadas por los autores.
- Entrenado con guidance distillation para mejorar la eficiencia.
- Distribuido en múltiples cuantizaciones GGUF, desde 2-bit hasta BF16/F16, con tamaños aproximados entre 4.02 GB y 23.8 GB.
- Disponible para inferencia local mediante ComfyUI y flujos basados en Diffusers.
Casos de uso
- Generación local de imágenes a partir de prompts de texto.
- Flujos creativos con ComfyUI basados en nodos.
- Investigación sobre modelos de difusión/flujo rectificado y cuantización GGUF.
- Prototipado de herramientas visuales que necesiten pesos abiertos y ejecución fuera de APIs cerradas.
- Creación de imágenes para usos personales, científicos y comerciales permitidos por la licencia FLUX.1 [dev] Non-Commercial License.