raulc0399/flux_dev_openpose_controlnet
raulc0399
Texto a imagen
ControlNet de OpenPose para FLUX.1 dev, entrenado para condicionar la generación de imágenes con poses humanas. El modelo usa el conjunto raulc0399/open_pose_controlnet y está pensado para ejecutarse con la canalización x-flux de XLabs-AI, permitiendo guiar composiciones de texto a imagen mediante una imagen de pose preprocesada.
Como usar
Instalación básica con Diffusers:
pip install -U diffusers transformers accelerate
from diffusers import ControlNetModel, StableDiffusionControlNetPipeline
controlnet = ControlNetModel.from_pretrained("raulc0399/flux_dev_openpose_controlnet")
pipe = StableDiffusionControlNetPipeline.from_pretrained(
"fill-in-base-model",
controlnet=controlnet
)
Uso recomendado con x-flux:
git clone https://github.com/XLabs-AI/x-flux.git
cd x-flux
python3 -m venv xflux_env
source xflux_env/bin/activate
pip install -r requirements.txt
python3 main.py \
--prompt "person enjoying a day at the park, full hd, cinematic" \
--image ~/open_pose_controlnet_dataset/validation_images/pose/3_pose_1024.jpg \
--control_type openpose \
--local_path ./model.safetensors \
--use_controlnet \
--model_type flux-dev \
--width 1024 \
--height 1024 \
--timestep_to_start_cfg 2 \
--num_steps 50 \
--true_gs 4 \
--guidance 4 \
--save_path ~/gen_imgs
Si la imagen ya fue preprocesada, la tarjeta indica comentar esta línea en src/flux/xflux_pipeline.py:
# self.annotator = Annotator(control_type, self.other_device)
Funcionalidades
- Generación texto-a-imagen condicionada por OpenPose para FLUX.1 dev.
- Pesos en formato Safetensors con aproximadamente 0.7B parámetros y tensor F32.
- Entrenado con el dataset raulc0399/open_pose_controlnet.
- Integración documentada con la pipeline x-flux de XLabs-AI.
- Licencia FLUX.1 dev no comercial.
Casos de uso
- Generar personas en poses específicas usando mapas OpenPose como condición visual.
- Recrear escenas humanas controlando postura y composición corporal en FLUX.1 dev.
- Probar o entrenar flujos personalizados de ControlNet para x-flux.
- Crear imágenes cinematográficas o realistas donde la pose de referencia debe mantenerse.