SG161222/RealVisXL_V5.0
SG161222
Texto a imagen
RealVisXL V5.0 es un modelo de generación de imágenes texto-a-imagen basado en Diffusers y Stable Diffusion XL, orientado al fotorealismo. Está pensado para producir imágenes realistas de calidad decente y puede generar contenido SFW y NSFW. El modelo se distribuye en formato Safetensors bajo licencia OpenRAIL++ y no aparece desplegado en proveedores de inferencia de Hugging Face.
Como usar
Uso recomendado según la tarjeta del modelo:
Prompt negativo recomendado: bad hands, bad anatomy, ugly, deformed, (face asymmetry, eyes asymmetry, deformed eyes, deformed mouth, open mouth) o un prompt negativo equivalente.
Parámetros de generación recomendados:
- Método de muestreo:
DPM++ SDE Karras con más de 30 pasos, o DPM++ 2M Karras con más de 50 pasos.
- Para Hires Fix: usar
DPM++ 2M Karras.
- Pasos de Hires: más de 25.
- Upscaler:
4x-NMKD-Superscale-SP_178000_G, 4x-UltraSharp upscaler u otro escalador similar.
- Denoising strength: entre
0.1 y 0.3.
- Factor de escalado: entre
1.1 y 1.5.
No se incluye un fragmento de código de inferencia en el HTML proporcionado.
Funcionalidades
- Generación texto-a-imagen con StableDiffusionXLPipeline.
- Enfoque explícito en fotorealismo.
- Compatible con flujos Diffusers y pesos Safetensors.
- Puede producir imágenes SFW y NSFW.
- Incluye recomendaciones concretas de prompt negativo y parámetros de muestreo.
- Cuenta con variantes relacionadas en el ecosistema del autor, como ParagonXL, NovaXL, RealDreamXL y versiones Lightning.
- Tiene página asociada en CivitAI y disponibilidad en Mage.Space.
Casos de uso
- Creación de retratos y escenas fotorealistas a partir de texto.
- Generación de imágenes realistas de alta calidad con SDXL.
- Flujos creativos que requieren Hires Fix y escalado controlado.
- Experimentación con prompts negativos para mejorar anatomía, manos, ojos, boca y simetría facial.
- Producción de imágenes SFW o NSFW cuando el entorno de uso y la licencia lo permitan.