SicariusSicariiStuff/FLUX.1-dev
SicariusSicariiStuff
Texto a imagen
FLUX.1 [dev] es un transformador de flujo rectificado de 12 mil millones de parámetros para generación de imágenes a partir de descripciones de texto. Está orientado a producir imágenes de alta calidad con buen seguimiento de prompts y pesos abiertos para investigación científica y flujos creativos.
Como usar
Implementación de referencia disponible en un repositorio dedicado de GitHub. También puede usarse mediante APIs de terceros como bfl.ml, replicate.com, fal.ai y mystic.ai, o localmente con ComfyUI.
Uso con Diffusers:
pip install -U diffusers
import torch
from diffusers import FluxPipeline
pipe = FluxPipeline.from_pretrained("black-forest-labs/FLUX.1-dev", torch_dtype=torch.bfloat16)
pipe.enable_model_cpu_offload() # save some VRAM by offloading the model to CPU. Remove this if you have enough GPU power
prompt = "A cat holding a sign that says hello world"
image = pipe(
prompt,
height=1024,
width=1024,
guidance_scale=3.5,
num_inference_steps=50,
max_sequence_length=512,
generator=torch.Generator("cpu").manual_seed(0)
).images[0]
image.save("flux-dev.png")
Funcionalidades
- Generación de imágenes a partir de texto con arquitectura rectified flow transformer de 12B parámetros.
- Calidad de salida avanzada, situada por debajo de FLUX.1 [pro] según la página del modelo.
- Seguimiento competitivo de instrucciones en prompts, comparable con alternativas cerradas.
- Entrenado con guidance distillation para mejorar la eficiencia.
- Pesos abiertos para investigación científica y desarrollo de flujos creativos.
- Compatible con Diffusers mediante FluxPipeline y disponible para inferencia local en ComfyUI.
Casos de uso
- Crear imágenes desde descripciones textuales.
- Experimentación e investigación científica con modelos de generación de imágenes.
- Desarrollo de flujos creativos personalizados para artistas y creadores.
- Inferencia local con ComfyUI usando un flujo visual basado en nodos.
- Integración en aplicaciones mediante Diffusers o proveedores API externos.