amk22/real_flux
amk22
Texto a imagen
Modelo de generación de imágenes a partir de texto basado en FLUX.1 [dev], un transformer de flujo rectificado de 12 mil millones de parámetros. Está orientado a producir imágenes de alta calidad desde descripciones textuales, con buen seguimiento de prompts y pesos abiertos bajo una licencia no comercial de FLUX.1 [dev].
Como usar
Instalación y uso con Diffusers para amk22/real_flux:
pip install -U diffusers transformers accelerate
import torch
from diffusers import DiffusionPipeline
# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained("amk22/real_flux", dtype=torch.bfloat16, device_map="cuda")
prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]
La tarjeta también incluye el ejemplo de referencia de FLUX.1 [dev] con FluxPipeline:
pip install -U diffusers
import torch
from diffusers import FluxPipeline
pipe = FluxPipeline.from_pretrained("black-forest-labs/FLUX.1-dev", torch_dtype=torch.bfloat16)
pipe.enable_model_cpu_offload() #save some VRAM by offloading the model to CPU. Remove this if you have enough GPU power
prompt = "A cat holding a sign that says hello world"
image = pipe(
prompt,
height=1024,
width=1024,
guidance_scale=3.5,
num_inference_steps=50,
max_sequence_length=512,
generator=torch.Generator("cpu").manual_seed(0)
).images[0]
image.save("flux-dev.png")
Funcionalidades
- Generación de imágenes desde texto con arquitectura FLUX.1 [dev].
- Calidad de salida avanzada, situada por debajo de FLUX.1 [pro] según la tarjeta del modelo.
- Seguimiento competitivo de instrucciones en prompts frente a alternativas cerradas.
- Entrenado con destilación de guía para mejorar la eficiencia.
- Compatible con Diffusers, ComfyUI y aplicaciones locales como Draw Things y DiffusionBee.
- Distribuido en formato Safetensors y etiquetado para FluxPipeline e image-generation.
Casos de uso
- Crear imágenes detalladas a partir de prompts textuales.
- Prototipar flujos creativos o artísticos con pesos abiertos de FLUX.1 [dev].
- Ejecutar inferencia local mediante Diffusers o ComfyUI.
- Experimentar con prompts, estilos visuales y composición de imágenes en investigación o producción creativa permitida por la licencia.