stablediffusionapi/epicrealism-xl
stablediffusionapi
Texto a imagen
Modelo de texto a imagen basado en Stable Diffusion XL, orientado a generar imágenes ultra realistas con alto nivel de detalle, iluminación cinematográfica y estética fotográfica. Está publicado por Stable Diffusion API en Hugging Face y se usa mediante Diffusers o la API de ModelsLab con el identificador `epicrealism-xl`.
Como usar
Instalación y uso con Diffusers:
pip install -U diffusers transformers accelerate
import torch
from diffusers import DiffusionPipeline
# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained("stablediffusionapi/epicrealism-xl", dtype=torch.bfloat16, device_map="cuda")
prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]
Uso mediante la API de ModelsLab:
import requests
import json
url = "https://modelslab.com/api/v6/images/text2img"
payload = json.dumps({
"key": "your_api_key",
"model_id": "epicrealism-xl",
"prompt": "ultra realistic close up portrait ((beautiful pale cyberpunk female with heavy black eyeliner)), blue eyes, shaved side haircut, hyper detail, cinematic lighting, magic neon, dark red city, Canon EOS R3, nikon, f/1.4, ISO 200, 1/160s, 8K, RAW, unedited, symmetrical balance, in-frame, 8K",
"negative_prompt": "painting, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, deformed, ugly, blurry, bad anatomy, bad proportions, extra limbs, cloned face, skinny, glitchy, double torso, extra arms, extra hands, mangled fingers, missing lips, ugly face, distorted face, extra legs, anime",
"width": "512",
"height": "512",
"samples": "1",
"num_inference_steps": "30",
"safety_checker": "no",
"enhance_prompt": "yes",
"seed": None,
"guidance_scale": 7.5,
"multi_lingual": "no",
"panorama": "no",
"self_attention": "no",
"upscale": "no",
"embeddings": "embeddings_model_id",
"lora": "lora_model_id",
"webhook": None,
"track_id": None
})
headers = {
'Content-Type': 'application/json'
}
response = requests.request("POST", url, headers=headers, data=payload)
print(response.text)
Funcionalidades
- Generación de imágenes a partir de texto con enfoque ultra realista.
- Compatible con `DiffusionPipeline` de Diffusers y Stable Diffusion XL.
- Soporta prompts positivos y negativos para controlar composición, estilo y defectos visuales.
- Permite configurar resolución, número de muestras, pasos de inferencia, escala de guía, semilla, mejora de prompt, panorámica, upscale, LoRA y embeddings mediante la API de ModelsLab.
- Licencia `creativeml-openrail-m`.
- No aparece desplegado por proveedores de inferencia de Hugging Face en la página indicada.
Casos de uso
- Crear retratos fotorealistas con iluminación cinematográfica y detalles de cámara.
- Generar imágenes realistas desde prompts descriptivos para pruebas creativas, prototipos visuales o contenido gráfico.
- Experimentar con Stable Diffusion XL localmente mediante Diffusers.
- Integrar generación de imágenes en aplicaciones usando la API de ModelsLab.
- Probar prompts negativos para reducir errores anatómicos, desenfoque, rostros deformados o artefactos visuales.