lzyvegetable/FLUX.1-schnell

lzyvegetable

Texto a imagen

Modelo de texto a imagen basado en un transformer de flujo rectificado de 12 mil millones de parámetros, optimizado para generar imágenes de alta calidad a partir de descripciones en texto en solo 1 a 4 pasos. Está orientado a inferencia rápida, con buen seguimiento de prompts y uso permitido para fines personales, científicos y comerciales bajo licencia Apache-2.0.

Como usar

La implementación de referencia y el código de muestreo están disponibles en un repositorio dedicado de GitHub, pensado como punto de partida para desarrolladores y creativos.
Con Diffusers, primero instala o actualiza la librería:
pip install -U diffusers

Luego puedes ejecutar el modelo con FluxPipeline:
import torch
from diffusers import FluxPipeline

pipe = FluxPipeline.from_pretrained("black-forest-labs/FLUX.1-schnell", torch_dtype=torch.bfloat16)
pipe.enable_model_cpu_offload()  # ahorra VRAM moviendo parte del modelo a CPU

prompt = "A cat holding a sign that says hello world"
image = pipe(
    prompt,
    guidance_scale=0.0,
    num_inference_steps=4,
    max_sequence_length=256,
    generator=torch.Generator("cpu").manual_seed(0)
).images[0]

image.save("flux-schnell.png")

También se indica disponibilidad mediante API en bfl.ml, replicate.com, fal.ai y mystic.ai, y soporte para flujos locales con nodos en ComfyUI.

Funcionalidades

Generación de imágenes desde texto con arquitectura `FluxPipeline`
12 mil millones de parámetros
Salida de alta calidad con seguimiento de prompts competitivo
Genera imágenes en 1 a 4 pasos
Entrenado con destilación de difusión adversarial latente
Compatible con Diffusers
Disponible para inferencia local en ComfyUI
Licencia `apache-2.0` para uso personal, científico y comercial

Casos de uso

Generación rápida de imágenes a partir de prompts de texto
Prototipado creativo con baja cantidad de pasos de inferencia
Integración en aplicaciones de generación visual mediante Diffusers
Inferencia local con flujos visuales en ComfyUI
Uso comercial o científico en proyectos que requieran generación de imágenes