ModelsLab/RealVisXL_V5.0_Lightning

ModelsLab

Texto a imagen

Modelo de texto a imagen basado en Stable Diffusion XL y orientado al fotorealismo. Esta variante Lightning está pensada para generar imágenes realistas con pocos pasos de muestreo, usando Diffusers/Safetensors y la licencia openrail++. La ficha indica que puede producir imágenes SFW y NSFW de calidad decente.

Como usar

Instalación y uso con Diffusers:
pip install -U diffusers transformers accelerate

import torch
from diffusers import DiffusionPipeline

# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained("ModelsLab/RealVisXL_V5.0_Lightning", dtype=torch.bfloat16, device_map="cuda")

prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]

Parámetros recomendados por la ficha: Sampling Steps: 5; Sampling Method: DPM++ SDE Karras / DPM++ SDE; CFG Scale: 1.0-2.0. Para hires fix: Hires steps: 3; upscaler 4x-NMKD-Superscale-SP_178000_G, 4x-UltraSharp u otro; denoising strength: 0.5; upscale by: 1.1-1.5.

Funcionalidades

Generación de imágenes fotorealistas desde prompts de texto.
Compatible con Diffusers mediante StableDiffusionXLPipeline/DiffusionPipeline.
Distribuido en formato Safetensors.
Optimizado para pocos pasos de generación: se recomiendan 5 pasos de muestreo.
Parámetros sugeridos: DPM++ SDE Karras o DPM++ SDE, CFG Scale entre 1.0 y 2.0.
Incluye recomendaciones de negative prompt para reducir artefactos como mala anatomía, manos deformes, baja calidad o estilo no deseado.
Compatible con flujos locales como Draw Things y DiffusionBee.

Casos de uso

Crear imágenes fotorealistas a partir de descripciones textuales.
Generar retratos, escenas cinematográficas o composiciones realistas con SDXL.
Probar flujos rápidos de generación con modelos Lightning de pocos pasos.
Usar el modelo en entornos locales o notebooks con Diffusers, Google Colab o Kaggle.
Experimentar con negative prompts detallados para mejorar anatomía, nitidez y realismo.