PhotoMaker

TencentARC
Texto a imagen

PhotoMaker permite a los usuarios introducir una o varias fotos de rostros, junto con un texto descriptivo, para recibir una foto personalizada o una pintura en segundos (¡sin necesidad de entrenamiento!). Además, este modelo puede adaptarse a cualquier modelo base basado en SDXL o usarse en conjunto con otros módulos LoRA.

Como usar

Puede descargar directamente el modelo en este repositorio. También puede descargar el modelo en un script de Python:

from huggingface_hub import hf_hub_download
photomaker_ckpt = hf_hub_download(repo_id="TencentARC/PhotoMaker", filename="photomaker-v1.bin", repo_type="model")

Luego, siga las instrucciones en nuestro repositorio de GitHub.

Funcionalidades

Resultados realistas
Resultados de estilización
Encoder id incluye OpenCLIP-ViT-H-14 finetuneado y algunas capas de fusión
lora_weights se aplica a todas las capas de atención en el UNet, con un rango establecido en 64

Casos de uso

Personalización de fotos realistas y estilizadas
Creación de pinturas y avatares en cualquier estilo en segundos