camenduru/FLUX.1-dev-ungated
camenduru
Texto a imagen
FLUX.1 [dev] es un transformador de flujo rectificado de 12 mil millones de parámetros para generación de imágenes a partir de descripciones de texto. Este repositorio ofrece una versión ungated del modelo FLUX.1-dev para flujos de trabajo de texto a imagen con Diffusers, Safetensors y FluxPipeline.
Como usar
El modelo puede usarse mediante una implementación de referencia en GitHub, APIs externas compatibles, ComfyUI o la librería Diffusers.
Instalación de Diffusers:
pip install -U diffusers
Ejemplo con FluxPipeline:
import torch
from diffusers import FluxPipeline
pipe = FluxPipeline.from_pretrained("black-forest-labs/FLUX.1-dev", torch_dtype=torch.bfloat16)
pipe.enable_model_cpu_offload() #save some VRAM by offloading the model to CPU. Remove this if you have enough GPU power
prompt = "A cat holding a sign that says hello world"
image = pipe(
prompt,
height=1024,
width=1024,
guidance_scale=3.5,
num_inference_steps=50,
max_sequence_length=512,
generator=torch.Generator("cpu").manual_seed(0)
).images[0]
image.save("flux-dev.png")
Funcionalidades
- Generación de imágenes de alta calidad desde prompts de texto.
- Seguimiento competitivo de instrucciones, cercano al rendimiento de alternativas cerradas.
- Entrenado con destilación de guía para mejorar la eficiencia de muestreo.
- Pesos abiertos orientados a investigación científica y flujos creativos personalizados.
- Compatible con Diffusers y ComfyUI para inferencia local o integrada en pipelines.
Casos de uso
- Generar imágenes detalladas a partir de descripciones textuales.
- Crear prototipos visuales, arte conceptual e imágenes para flujos creativos personales o comerciales permitidos por la licencia.
- Investigar modelos de generación de imágenes con pesos abiertos.
- Ejecutar inferencia local en ComfyUI con flujos node-based.
- Integrar generación de imágenes en aplicaciones Python mediante Diffusers.