FLUX.1 Krea [dev]
black-forest-labs
Texto a imagen
Modelo de texto a imagen de Black Forest Labs y Krea, basado en un transformer de flujo rectificado de 12 mil millones de parámetros. Está orientado a generar imágenes con fuerte calidad estética fotográfica, buen seguimiento de prompts y mayor eficiencia gracias a guidance distillation. Es un ajuste sobre FLUX.1 [dev] con pesos abiertos bajo licencia no comercial.
Como usar
Puede usarse como reemplazo directo de FLUX.1 [dev] en sistemas compatibles. Está disponible en ComfyUI mediante descarga de pesos .safetensors, y en diffusers con FluxPipeline.
Primero, instala o actualiza diffusers:
pip install -U diffusers
Ejemplo con diffusers:
import torch
from diffusers import FluxPipeline
pipe = FluxPipeline.from_pretrained("black-forest-labs/FLUX.1-Krea-dev", torch_dtype=torch.bfloat16)
pipe.enable_model_cpu_offload() #save some VRAM by offloading the model to CPU. Remove this if you have enough GPU VRAM
prompt = "A frog holding a sign that says hello world"
image = pipe(
prompt,
height=1024,
width=1024,
guidance_scale=4.5,
).images[0]
image.save("flux-krea-dev.png")
También se indica una implementación de referencia de FLUX.1 [dev] en su repositorio dedicado de GitHub y documentación adicional en diffusers.
Funcionalidades
- Generación de imágenes a partir de descripciones de texto
- 12 mil millones de parámetros con arquitectura rectified flow transformer
- Enfoque en fotografía estética y alta calidad visual
- Seguimiento de prompts competitivo frente a alternativas cerradas
- Entrenado con guidance distillation para mejorar la eficiencia
- Compatible como reemplazo directo en sistemas que ya soportan FLUX.1 [dev]
- Disponible para uso en ComfyUI y en la librería diffusers
- Pesos abiertos para investigación y flujos creativos
Casos de uso
- Generación de imágenes fotográficas estilizadas a partir de prompts de texto
- Prototipado visual para artistas y creativos que trabajan con pipelines FLUX
- Investigación científica sobre modelos generativos con pesos abiertos
- Integración en flujos de trabajo de ComfyUI para creación visual
- Desarrollo de aplicaciones de generación de imágenes usando diffusers