unsloth/FLUX.1-dev-GGUF

unsloth
Texto a imagen

Versión cuantizada en formato GGUF de FLUX.1 [dev], un transformador de flujo rectificado de 12 mil millones de parámetros para generar imágenes a partir de descripciones de texto. Está orientado a inferencia local y flujos de trabajo de investigación o creación visual, con pesos abiertos bajo la licencia no comercial de FLUX.1 [dev].

Como usar

El modelo puede usarse como punto de partida para desarrolladores y creadores que quieran construir flujos de generación de imágenes sobre FLUX.1 [dev]. La tarjeta enlaza una implementación de referencia y código de muestreo en GitHub.

También puede ejecutarse con Diffusers instalando o actualizando la librería:

pip install -U diffusers

Ejemplo con FluxPipeline:

import torch
from diffusers import FluxPipeline

pipe = FluxPipeline.from_pretrained("black-forest-labs/FLUX.1-dev", torch_dtype=torch.bfloat16)
pipe.enable_model_cpu_offload() #save some VRAM by offloading the model to CPU. Remove this if you have enough GPU power

prompt = "A cat holding a sign that says hello world"
image = pipe(
    prompt,
    height=1024,
    width=1024,
    guidance_scale=3.5,
    num_inference_steps=50,
    max_sequence_length=512,
    generator=torch.Generator("cpu").manual_seed(0)
).images[0]
image.save("flux-dev.png")

Funcionalidades

Generación de imágenes desde texto con arquitectura FLUX de 12B parámetros.
Calidad de salida avanzada, situada por debajo de FLUX.1 [pro] según la tarjeta del modelo.
Seguimiento competitivo de prompts, comparable con alternativas cerradas mencionadas por los autores.
Entrenado con guidance distillation para mejorar la eficiencia.
Distribuido en múltiples cuantizaciones GGUF, desde 2-bit hasta BF16/F16, con tamaños aproximados entre 4.02 GB y 23.8 GB.
Disponible para inferencia local mediante ComfyUI y flujos basados en Diffusers.

Casos de uso

Generación local de imágenes a partir de prompts de texto.
Flujos creativos con ComfyUI basados en nodos.
Investigación sobre modelos de difusión/flujo rectificado y cuantización GGUF.
Prototipado de herramientas visuales que necesiten pesos abiertos y ejecución fuera de APIs cerradas.
Creación de imágenes para usos personales, científicos y comerciales permitidos por la licencia FLUX.1 [dev] Non-Commercial License.