camenduru/FLUX.1-dev-ungated

camenduru

Texto a imagen

FLUX.1 [dev] es un transformador de flujo rectificado de 12 mil millones de parámetros para generación de imágenes a partir de descripciones de texto. Este repositorio ofrece una versión ungated del modelo FLUX.1-dev para flujos de trabajo de texto a imagen con Diffusers, Safetensors y FluxPipeline.

Como usar

El modelo puede usarse mediante una implementación de referencia en GitHub, APIs externas compatibles, ComfyUI o la librería Diffusers.
Instalación de Diffusers:
pip install -U diffusers

Ejemplo con FluxPipeline:
import torch
from diffusers import FluxPipeline

pipe = FluxPipeline.from_pretrained("black-forest-labs/FLUX.1-dev", torch_dtype=torch.bfloat16)
pipe.enable_model_cpu_offload() #save some VRAM by offloading the model to CPU. Remove this if you have enough GPU power

prompt = "A cat holding a sign that says hello world"
image = pipe(
    prompt,
    height=1024,
    width=1024,
    guidance_scale=3.5,
    num_inference_steps=50,
    max_sequence_length=512,
    generator=torch.Generator("cpu").manual_seed(0)
).images[0]
image.save("flux-dev.png")

Funcionalidades

Generación de imágenes de alta calidad desde prompts de texto.
Seguimiento competitivo de instrucciones, cercano al rendimiento de alternativas cerradas.
Entrenado con destilación de guía para mejorar la eficiencia de muestreo.
Pesos abiertos orientados a investigación científica y flujos creativos personalizados.
Compatible con Diffusers y ComfyUI para inferencia local o integrada en pipelines.

Casos de uso

Generar imágenes detalladas a partir de descripciones textuales.
Crear prototipos visuales, arte conceptual e imágenes para flujos creativos personales o comerciales permitidos por la licencia.
Investigar modelos de generación de imágenes con pesos abiertos.
Ejecutar inferencia local en ComfyUI con flujos node-based.
Integrar generación de imágenes en aplicaciones Python mediante Diffusers.