Heouzen/LoKR_mc_woman_FLUX1D

Heouzen
Texto a imagen

LoKR/LoRA para FLUX.1-dev orientado a generar imágenes de una mujer identificada por el disparador `mc_woman`. El modelo fue entrenado con AI Toolkit y está pensado para conservar rasgos faciales, textura de piel, cabello oscuro ondulado y estilos fotográficos variados, desde retratos de primer plano hasta escenas de moda, selfies, exteriores y composiciones de cuerpo completo.

Como usar

Instalación y carga básica con Diffusers:

pip install -U diffusers transformers accelerate
import torch
from diffusers import DiffusionPipeline

# Cambiar a "mps" en dispositivos Apple
pipe = DiffusionPipeline.from_pretrained(
    "black-forest-labs/FLUX.1-dev",
    dtype=torch.bfloat16,
    device_map="cuda"
)
pipe.load_lora_weights("Heouzen/LoKR_mc_woman_FLUX1D")

prompt = "mc_woman, a young woman with long, wavy dark brown hair, is seated on a brown sofa. She has a warm expression, looking slightly to her left with a gentle smile."
image = pipe(prompt).images[0]

Uso con el archivo Safetensors específico:

from diffusers import AutoPipelineForText2Image
import torch

pipeline = AutoPipelineForText2Image.from_pretrained(
    'black-forest-labs/FLUX.1-dev',
    torch_dtype=torch.bfloat16
).to('cuda')

pipeline.load_lora_weights(
    'Heouzen/LoKR_mc_woman_FLUX1D',
    weight_name='LoKR_mc_woman_FLUX1D.safetensors'
)

image = pipeline(
    'mc_woman, a young woman with long, wavy dark brown hair, is seated on a brown sofa. She has a warm expression, looking slightly to her left with a gentle smile. She is dressed in a white short-sleeved, form-fitting crop top that reveals her midriff, paired with a light blue denim mini skirt. A black watch with a round face is on her left wrist, and her left hand rests casually on her right thigh. Behind her is a wall with textured glass block panels and a round mirror.'
).images[0]

image.save("my_image.png")

Funcionalidades

Adaptador LoKR/LoRA para el modelo base black-forest-labs/FLUX.1-dev.
Tarea principal: generación de imágenes a partir de texto.
Palabra disparadora recomendada: `mc_woman`.
Pesos disponibles en formato Safetensors.
Compatible con Diffusers y utilizable en ComfyUI, AUTOMATIC1111, SD.Next e Invoke AI.
Entrenamiento por fases: dataset completo para anatomía e identidad, dataset reducido para reducir ruido y fase de primeros planos para microtextura facial.
Checkpoints recomendados por la tarjeta del modelo: 2500 o 3600.
Configuración sugerida: fuerza LoRA entre 0.8 y 0.9 y guidance scale 3.5.

Casos de uso

Generar retratos fotográficos de una mujer con rasgos consistentes usando el token `mc_woman`.
Crear variaciones de moda, selfies, escenas interiores, exteriores, playa o supermercado manteniendo identidad visual similar.
Probar checkpoints de entrenamiento para equilibrar naturalidad, textura facial y fidelidad de identidad.
Integrar un adaptador LoRA/LoKR de FLUX.1-dev en flujos locales con Diffusers, ComfyUI, AUTOMATIC1111, SD.Next o Invoke AI.