SG161222/RealVisXL_V5.0

SG161222

Texto a imagen

RealVisXL V5.0 es un modelo de generación de imágenes texto-a-imagen basado en Diffusers y Stable Diffusion XL, orientado al fotorealismo. Está pensado para producir imágenes realistas de calidad decente y puede generar contenido SFW y NSFW. El modelo se distribuye en formato Safetensors bajo licencia OpenRAIL++ y no aparece desplegado en proveedores de inferencia de Hugging Face.

Como usar

Uso recomendado según la tarjeta del modelo:
Prompt negativo recomendado: bad hands, bad anatomy, ugly, deformed, (face asymmetry, eyes asymmetry, deformed eyes, deformed mouth, open mouth) o un prompt negativo equivalente.
Parámetros de generación recomendados:

Método de muestreo: DPM++ SDE Karras con más de 30 pasos, o DPM++ 2M Karras con más de 50 pasos.
Para Hires Fix: usar DPM++ 2M Karras.
Pasos de Hires: más de 25.
Upscaler: 4x-NMKD-Superscale-SP_178000_G, 4x-UltraSharp upscaler u otro escalador similar.
Denoising strength: entre 0.1 y 0.3.
Factor de escalado: entre 1.1 y 1.5.

No se incluye un fragmento de código de inferencia en el HTML proporcionado.

Funcionalidades

Generación texto-a-imagen con StableDiffusionXLPipeline.
Enfoque explícito en fotorealismo.
Compatible con flujos Diffusers y pesos Safetensors.
Puede producir imágenes SFW y NSFW.
Incluye recomendaciones concretas de prompt negativo y parámetros de muestreo.
Cuenta con variantes relacionadas en el ecosistema del autor, como ParagonXL, NovaXL, RealDreamXL y versiones Lightning.
Tiene página asociada en CivitAI y disponibilidad en Mage.Space.

Casos de uso

Creación de retratos y escenas fotorealistas a partir de texto.
Generación de imágenes realistas de alta calidad con SDXL.
Flujos creativos que requieren Hires Fix y escalado controlado.
Experimentación con prompts negativos para mejorar anatomía, manos, ojos, boca y simetría facial.
Producción de imágenes SFW o NSFW cuando el entorno de uso y la licencia lo permitan.