ModelsLab/RealVisXL_V5.0_Lightning
ModelsLab
Texto a imagen
Modelo de texto a imagen basado en Stable Diffusion XL y orientado al fotorealismo. Esta variante Lightning está pensada para generar imágenes realistas con pocos pasos de muestreo, usando Diffusers/Safetensors y la licencia openrail++. La ficha indica que puede producir imágenes SFW y NSFW de calidad decente.
Como usar
Instalación y uso con Diffusers:
pip install -U diffusers transformers accelerate
import torch
from diffusers import DiffusionPipeline
# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained("ModelsLab/RealVisXL_V5.0_Lightning", dtype=torch.bfloat16, device_map="cuda")
prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]
Parámetros recomendados por la ficha: Sampling Steps: 5; Sampling Method: DPM++ SDE Karras / DPM++ SDE; CFG Scale: 1.0-2.0. Para hires fix: Hires steps: 3; upscaler 4x-NMKD-Superscale-SP_178000_G, 4x-UltraSharp u otro; denoising strength: 0.5; upscale by: 1.1-1.5.
Funcionalidades
- Generación de imágenes fotorealistas desde prompts de texto.
- Compatible con Diffusers mediante StableDiffusionXLPipeline/DiffusionPipeline.
- Distribuido en formato Safetensors.
- Optimizado para pocos pasos de generación: se recomiendan 5 pasos de muestreo.
- Parámetros sugeridos: DPM++ SDE Karras o DPM++ SDE, CFG Scale entre 1.0 y 2.0.
- Incluye recomendaciones de negative prompt para reducir artefactos como mala anatomía, manos deformes, baja calidad o estilo no deseado.
- Compatible con flujos locales como Draw Things y DiffusionBee.
Casos de uso
- Crear imágenes fotorealistas a partir de descripciones textuales.
- Generar retratos, escenas cinematográficas o composiciones realistas con SDXL.
- Probar flujos rápidos de generación con modelos Lightning de pocos pasos.
- Usar el modelo en entornos locales o notebooks con Diffusers, Google Colab o Kaggle.
- Experimentar con negative prompts detallados para mejorar anatomía, nitidez y realismo.