stablediffusionapi/epicrealism-xl

stablediffusionapi

Texto a imagen

Modelo de texto a imagen basado en Stable Diffusion XL, orientado a generar imágenes ultra realistas con alto nivel de detalle, iluminación cinematográfica y estética fotográfica. Está publicado por Stable Diffusion API en Hugging Face y se usa mediante Diffusers o la API de ModelsLab con el identificador `epicrealism-xl`.

Como usar

Instalación y uso con Diffusers:
pip install -U diffusers transformers accelerate

import torch
from diffusers import DiffusionPipeline

# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained("stablediffusionapi/epicrealism-xl", dtype=torch.bfloat16, device_map="cuda")

prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]

Uso mediante la API de ModelsLab:
import requests
import json

url = "https://modelslab.com/api/v6/images/text2img"

payload = json.dumps({
  "key": "your_api_key",
  "model_id": "epicrealism-xl",
  "prompt": "ultra realistic close up portrait ((beautiful pale cyberpunk female with heavy black eyeliner)), blue eyes, shaved side haircut, hyper detail, cinematic lighting, magic neon, dark red city, Canon EOS R3, nikon, f/1.4, ISO 200, 1/160s, 8K, RAW, unedited, symmetrical balance, in-frame, 8K",
  "negative_prompt": "painting, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, deformed, ugly, blurry, bad anatomy, bad proportions, extra limbs, cloned face, skinny, glitchy, double torso, extra arms, extra hands, mangled fingers, missing lips, ugly face, distorted face, extra legs, anime",
  "width": "512",
  "height": "512",
  "samples": "1",
  "num_inference_steps": "30",
  "safety_checker": "no",
  "enhance_prompt": "yes",
  "seed": None,
  "guidance_scale": 7.5,
  "multi_lingual": "no",
  "panorama": "no",
  "self_attention": "no",
  "upscale": "no",
  "embeddings": "embeddings_model_id",
  "lora": "lora_model_id",
  "webhook": None,
  "track_id": None
})

headers = {
  'Content-Type': 'application/json'
}

response = requests.request("POST", url, headers=headers, data=payload)

print(response.text)

Funcionalidades

Generación de imágenes a partir de texto con enfoque ultra realista.
Compatible con `DiffusionPipeline` de Diffusers y Stable Diffusion XL.
Soporta prompts positivos y negativos para controlar composición, estilo y defectos visuales.
Permite configurar resolución, número de muestras, pasos de inferencia, escala de guía, semilla, mejora de prompt, panorámica, upscale, LoRA y embeddings mediante la API de ModelsLab.
Licencia `creativeml-openrail-m`.
No aparece desplegado por proveedores de inferencia de Hugging Face en la página indicada.

Casos de uso

Crear retratos fotorealistas con iluminación cinematográfica y detalles de cámara.
Generar imágenes realistas desde prompts descriptivos para pruebas creativas, prototipos visuales o contenido gráfico.
Experimentar con Stable Diffusion XL localmente mediante Diffusers.
Integrar generación de imágenes en aplicaciones usando la API de ModelsLab.
Probar prompts negativos para reducir errores anatómicos, desenfoque, rostros deformados o artefactos visuales.