FLUX.1 Krea [dev]

black-forest-labs

Texto a imagen

Modelo de texto a imagen de Black Forest Labs y Krea, basado en un transformer de flujo rectificado de 12 mil millones de parámetros. Está orientado a generar imágenes con fuerte calidad estética fotográfica, buen seguimiento de prompts y mayor eficiencia gracias a guidance distillation. Es un ajuste sobre FLUX.1 [dev] con pesos abiertos bajo licencia no comercial.

Como usar

Puede usarse como reemplazo directo de FLUX.1 [dev] en sistemas compatibles. Está disponible en ComfyUI mediante descarga de pesos .safetensors, y en diffusers con FluxPipeline.
Primero, instala o actualiza diffusers:
pip install -U diffusers

Ejemplo con diffusers:
import torch
from diffusers import FluxPipeline

pipe = FluxPipeline.from_pretrained("black-forest-labs/FLUX.1-Krea-dev", torch_dtype=torch.bfloat16)
pipe.enable_model_cpu_offload() #save some VRAM by offloading the model to CPU. Remove this if you have enough GPU VRAM

prompt = "A frog holding a sign that says hello world"
image = pipe(
    prompt,
    height=1024,
    width=1024,
    guidance_scale=4.5,
).images[0]
image.save("flux-krea-dev.png")

También se indica una implementación de referencia de FLUX.1 [dev] en su repositorio dedicado de GitHub y documentación adicional en diffusers.

Funcionalidades

Generación de imágenes a partir de descripciones de texto
12 mil millones de parámetros con arquitectura rectified flow transformer
Enfoque en fotografía estética y alta calidad visual
Seguimiento de prompts competitivo frente a alternativas cerradas
Entrenado con guidance distillation para mejorar la eficiencia
Compatible como reemplazo directo en sistemas que ya soportan FLUX.1 [dev]
Disponible para uso en ComfyUI y en la librería diffusers
Pesos abiertos para investigación y flujos creativos

Casos de uso

Generación de imágenes fotográficas estilizadas a partir de prompts de texto
Prototipado visual para artistas y creativos que trabajan con pipelines FLUX
Investigación científica sobre modelos generativos con pesos abiertos
Integración en flujos de trabajo de ComfyUI para creación visual
Desarrollo de aplicaciones de generación de imágenes usando diffusers