stablediffusionapi/dreamshaper-xl-turbo-v2.1

stablediffusionapi

Texto a imagen

DreamShaper XL Turbo v2.1 es un modelo de generación de imágenes texto-a-imagen basado en Stable Diffusion XL, orientado a producir imágenes ultra realistas. Está publicado en Hugging Face por Stable Diffusion API y se puede usar con Diffusers o mediante la API de ModelsLab.

Como usar

Instalación y uso con Diffusers:
pip install -U diffusers transformers accelerate

import torch
from diffusers import DiffusionPipeline

# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained("stablediffusionapi/dreamshaper-xl-turbo-v2.1", dtype=torch.bfloat16, device_map="cuda")

prompt = "a girl wandering through the forest"
image = pipe(prompt).images[0]

Uso mediante la API de ModelsLab:
import requests
import json

url = "https://modelslab.com/api/v6/images/text2img"

payload = json.dumps({
  "key": "your_api_key",
  "model_id": "dreamshaper-xl-turbo-v2.1",
  "prompt": "ultra realistic close up portrait ((beautiful pale cyberpunk female with heavy black eyeliner)), blue eyes, shaved side haircut, hyper detail, cinematic lighting, magic neon, dark red city, Canon EOS R3, nikon, f/1.4, ISO 200, 1/160s, 8K, RAW, unedited, symmetrical balance, in-frame, 8K",
  "negative_prompt": "painting, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, deformed, ugly, blurry, bad anatomy, bad proportions, extra limbs, cloned face, skinny, glitchy, double torso, extra arms, extra hands, mangled fingers, missing lips, ugly face, distorted face, extra legs, anime",
  "width": "512",
  "height": "512",
  "samples": "1",
  "num_inference_steps": "30",
  "safety_checker": "no",
  "enhance_prompt": "yes",
  "seed": None,
  "guidance_scale": 7.5,
  "multi_lingual": "no",
  "panorama": "no",
  "self_attention": "no",
  "upscale": "no",
  "embeddings": "",
  "lora": "",
  "webhook": None,
  "track_id": None
})

headers = {
  'Content-Type': 'application/json'
}

response = requests.request("POST", url, headers=headers, data=payload)

print(response.text)

Funcionalidades

Generación texto-a-imagen con Stable Diffusion XL Pipeline.
Compatible con Diffusers y pesos en formato Safetensors.
Optimizado para resultados ultra realistas.
Puede ejecutarse localmente con DiffusionPipeline usando CUDA o MPS en dispositivos Apple.
Disponible también mediante la API text2img de ModelsLab.
Incluye parámetros habituales de generación como prompt negativo, tamaño, muestras, pasos de inferencia, escala de guía, semilla, mejora de prompt y opciones de upscale/panorama.

Casos de uso

Crear retratos ultra realistas a partir de prompts detallados.
Generar escenas cinematográficas, de fantasía o cyberpunk con iluminación compleja.
Prototipar imágenes 512x512 desde Python usando Diffusers o una API HTTP.
Integrar generación de imágenes en aplicaciones web o backend mediante ModelsLab.