TheImposterImposters/LUSTIFY-v2.0
Checkpoint SDXL 1.0 fotorealista para generación texto-a-imagen, publicado en Hugging Face como modelo Diffusers/Safetensors. La versión 2 fue entrenada con unas 26.535 iteraciones adicionales sobre un conjunto nuevo de imágenes, con mejor variedad de estilos, mejor comprensión de prompts en lenguaje natural, mayor adherencia al prompt y resultados SFW más sólidos. También puede generar contenido adulto, aunque el autor indica que las escenas hardcore son menos consistentes en V2 y pueden requerir varios reintentos.
Como usar
Instalación y uso con Diffusers:
pip install -U diffusers transformers accelerate
import torch
from diffusers import DiffusionPipeline
# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained(
"TheImposterImposters/LUSTIFY-v2.0",
dtype=torch.bfloat16,
device_map="cuda"
)
prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]
Parámetros recomendados por el autor: sampler DPM++ 2M SDE o DPM++ 3M SDE, scheduler Exponential o Karras, 30 pasos, CFG entre 4 y 7, y highres.fix con escalado 1.4-1.5 y denoising cercano a 0.4. Para tomas lejanas de personas se recomienda usar highres.fix y/o adetailer. En Fooocus, si la salida aparece rota, el autor recomienda desactivar el estilo "Fooocus Enhance".
Funcionalidades
- Basado en SDXL 1.0 y utilizable con StableDiffusionXLPipeline/Diffusers.
- Checkpoint fotorealista orientado tanto a imágenes SFW como a contenido adulto.
- Mejor comprensión de lenguaje natural y de etiquetas tipo danbooru frente a la versión anterior.
- Mayor variedad estética y mejor adherencia al prompt en V2.
- Soporta estilos fotográficos con etiquetas de cámara, película, iluminación y fotógrafos.
- Puede necesitar highres.fix, inpainting o adetailer para mejorar manos, rostros o personas en tomas lejanas.
- No está desplegado por proveedores de inferencia en Hugging Face según la página.
Casos de uso
- Generación fotorealista texto-a-imagen con SDXL.
- Imágenes SFW de objetos, animales, criaturas fantásticas, moda, fotografía analógica y escenas estilizadas.
- Experimentación con prompts en lenguaje natural y etiquetas danbooru.
- Flujos locales en Diffusers, Draw Things o DiffusionBee.
- Creación de imágenes adultas en contextos permitidos por la plataforma y la ley aplicable.