raulc0399/flux_dev_openpose_controlnet

raulc0399

Texto a imagen

ControlNet de OpenPose para FLUX.1 dev, entrenado para condicionar la generación de imágenes con poses humanas. El modelo usa el conjunto raulc0399/open_pose_controlnet y está pensado para ejecutarse con la canalización x-flux de XLabs-AI, permitiendo guiar composiciones de texto a imagen mediante una imagen de pose preprocesada.

Como usar

Instalación básica con Diffusers:
pip install -U diffusers transformers accelerate

from diffusers import ControlNetModel, StableDiffusionControlNetPipeline

controlnet = ControlNetModel.from_pretrained("raulc0399/flux_dev_openpose_controlnet")
pipe = StableDiffusionControlNetPipeline.from_pretrained(
    "fill-in-base-model",
    controlnet=controlnet
)

Uso recomendado con x-flux:
git clone https://github.com/XLabs-AI/x-flux.git
cd x-flux
python3 -m venv xflux_env
source xflux_env/bin/activate
pip install -r requirements.txt

python3 main.py \
  --prompt "person enjoying a day at the park, full hd, cinematic" \
  --image ~/open_pose_controlnet_dataset/validation_images/pose/3_pose_1024.jpg \
  --control_type openpose \
  --local_path ./model.safetensors \
  --use_controlnet \
  --model_type flux-dev \
  --width 1024 \
  --height 1024 \
  --timestep_to_start_cfg 2 \
  --num_steps 50 \
  --true_gs 4 \
  --guidance 4 \
  --save_path ~/gen_imgs

Si la imagen ya fue preprocesada, la tarjeta indica comentar esta línea en src/flux/xflux_pipeline.py:
# self.annotator = Annotator(control_type, self.other_device)

Funcionalidades

Generación texto-a-imagen condicionada por OpenPose para FLUX.1 dev.
Pesos en formato Safetensors con aproximadamente 0.7B parámetros y tensor F32.
Entrenado con el dataset raulc0399/open_pose_controlnet.
Integración documentada con la pipeline x-flux de XLabs-AI.
Licencia FLUX.1 dev no comercial.

Casos de uso

Generar personas en poses específicas usando mapas OpenPose como condición visual.
Recrear escenas humanas controlando postura y composición corporal en FLUX.1 dev.
Probar o entrenar flujos personalizados de ControlNet para x-flux.
Crear imágenes cinematográficas o realistas donde la pose de referencia debe mantenerse.