lzyvegetable/FLUX.1-schnell
Modelo de texto a imagen basado en un transformer de flujo rectificado de 12 mil millones de parámetros, optimizado para generar imágenes de alta calidad a partir de descripciones en texto en solo 1 a 4 pasos. Está orientado a inferencia rápida, con buen seguimiento de prompts y uso permitido para fines personales, científicos y comerciales bajo licencia Apache-2.0.
Como usar
La implementación de referencia y el código de muestreo están disponibles en un repositorio dedicado de GitHub, pensado como punto de partida para desarrolladores y creativos.
Con Diffusers, primero instala o actualiza la librería:
pip install -U diffusers
Luego puedes ejecutar el modelo con FluxPipeline:
import torch
from diffusers import FluxPipeline
pipe = FluxPipeline.from_pretrained("black-forest-labs/FLUX.1-schnell", torch_dtype=torch.bfloat16)
pipe.enable_model_cpu_offload() # ahorra VRAM moviendo parte del modelo a CPU
prompt = "A cat holding a sign that says hello world"
image = pipe(
prompt,
guidance_scale=0.0,
num_inference_steps=4,
max_sequence_length=256,
generator=torch.Generator("cpu").manual_seed(0)
).images[0]
image.save("flux-schnell.png")
También se indica disponibilidad mediante API en bfl.ml, replicate.com, fal.ai y mystic.ai, y soporte para flujos locales con nodos en ComfyUI.
Funcionalidades
- Generación de imágenes desde texto con arquitectura `FluxPipeline`
- 12 mil millones de parámetros
- Salida de alta calidad con seguimiento de prompts competitivo
- Genera imágenes en 1 a 4 pasos
- Entrenado con destilación de difusión adversarial latente
- Compatible con Diffusers
- Disponible para inferencia local en ComfyUI
- Licencia `apache-2.0` para uso personal, científico y comercial
Casos de uso
- Generación rápida de imágenes a partir de prompts de texto
- Prototipado creativo con baja cantidad de pasos de inferencia
- Integración en aplicaciones de generación visual mediante Diffusers
- Inferencia local con flujos visuales en ComfyUI
- Uso comercial o científico en proyectos que requieran generación de imágenes