amk22/real_flux

amk22

Texto a imagen

Modelo de generación de imágenes a partir de texto basado en FLUX.1 [dev], un transformer de flujo rectificado de 12 mil millones de parámetros. Está orientado a producir imágenes de alta calidad desde descripciones textuales, con buen seguimiento de prompts y pesos abiertos bajo una licencia no comercial de FLUX.1 [dev].

Como usar

Instalación y uso con Diffusers para amk22/real_flux:
pip install -U diffusers transformers accelerate

import torch
from diffusers import DiffusionPipeline

# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained("amk22/real_flux", dtype=torch.bfloat16, device_map="cuda")

prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]

La tarjeta también incluye el ejemplo de referencia de FLUX.1 [dev] con FluxPipeline:
pip install -U diffusers

import torch
from diffusers import FluxPipeline

pipe = FluxPipeline.from_pretrained("black-forest-labs/FLUX.1-dev", torch_dtype=torch.bfloat16)
pipe.enable_model_cpu_offload() #save some VRAM by offloading the model to CPU. Remove this if you have enough GPU power

prompt = "A cat holding a sign that says hello world"
image = pipe(
    prompt,
    height=1024,
    width=1024,
    guidance_scale=3.5,
    num_inference_steps=50,
    max_sequence_length=512,
    generator=torch.Generator("cpu").manual_seed(0)
).images[0]
image.save("flux-dev.png")

Funcionalidades

Generación de imágenes desde texto con arquitectura FLUX.1 [dev].
Calidad de salida avanzada, situada por debajo de FLUX.1 [pro] según la tarjeta del modelo.
Seguimiento competitivo de instrucciones en prompts frente a alternativas cerradas.
Entrenado con destilación de guía para mejorar la eficiencia.
Compatible con Diffusers, ComfyUI y aplicaciones locales como Draw Things y DiffusionBee.
Distribuido en formato Safetensors y etiquetado para FluxPipeline e image-generation.

Casos de uso

Crear imágenes detalladas a partir de prompts textuales.
Prototipar flujos creativos o artísticos con pesos abiertos de FLUX.1 [dev].
Ejecutar inferencia local mediante Diffusers o ComfyUI.
Experimentar con prompts, estilos visuales y composición de imágenes en investigación o producción creativa permitida por la licencia.