TheImposterImposters/LUSTIFY-v2.0

TheImposterImposters

Texto a imagen

Checkpoint SDXL 1.0 fotorealista para generación texto-a-imagen, publicado en Hugging Face como modelo Diffusers/Safetensors. La versión 2 fue entrenada con unas 26.535 iteraciones adicionales sobre un conjunto nuevo de imágenes, con mejor variedad de estilos, mejor comprensión de prompts en lenguaje natural, mayor adherencia al prompt y resultados SFW más sólidos. También puede generar contenido adulto, aunque el autor indica que las escenas hardcore son menos consistentes en V2 y pueden requerir varios reintentos.

Como usar

Instalación y uso con Diffusers:
pip install -U diffusers transformers accelerate

import torch
from diffusers import DiffusionPipeline

# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained(
    "TheImposterImposters/LUSTIFY-v2.0",
    dtype=torch.bfloat16,
    device_map="cuda"
)

prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]

Parámetros recomendados por el autor: sampler DPM++ 2M SDE o DPM++ 3M SDE, scheduler Exponential o Karras, 30 pasos, CFG entre 4 y 7, y highres.fix con escalado 1.4-1.5 y denoising cercano a 0.4. Para tomas lejanas de personas se recomienda usar highres.fix y/o adetailer. En Fooocus, si la salida aparece rota, el autor recomienda desactivar el estilo "Fooocus Enhance".

Funcionalidades

Basado en SDXL 1.0 y utilizable con StableDiffusionXLPipeline/Diffusers.
Checkpoint fotorealista orientado tanto a imágenes SFW como a contenido adulto.
Mejor comprensión de lenguaje natural y de etiquetas tipo danbooru frente a la versión anterior.
Mayor variedad estética y mejor adherencia al prompt en V2.
Soporta estilos fotográficos con etiquetas de cámara, película, iluminación y fotógrafos.
Puede necesitar highres.fix, inpainting o adetailer para mejorar manos, rostros o personas en tomas lejanas.
No está desplegado por proveedores de inferencia en Hugging Face según la página.

Casos de uso

Generación fotorealista texto-a-imagen con SDXL.
Imágenes SFW de objetos, animales, criaturas fantásticas, moda, fotografía analógica y escenas estilizadas.
Experimentación con prompts en lenguaje natural y etiquetas danbooru.
Flujos locales en Diffusers, Draw Things o DiffusionBee.
Creación de imágenes adultas en contextos permitidos por la plataforma y la ley aplicable.