stablediffusionapi/realistic-vision-v6.0-b1-inpaint

stablediffusionapi

Texto a imagen

Modelo de generación e inpainting de imágenes basado en Stable Diffusion, orientado a crear retratos y escenas fotorrealistas de alta definición. Está publicado en Hugging Face por Stable Diffusion API y se puede usar con Diffusers o mediante la API de ModelsLab.

Como usar

Instalación y uso con Diffusers:
pip install -U diffusers transformers accelerate

import torch
from diffusers import DiffusionPipeline

# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained(
    "stablediffusionapi/realistic-vision-v6.0-b1-inpaint",
    dtype=torch.bfloat16,
    device_map="cuda"
)

prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]

Uso mediante API de ModelsLab:
import requests
import json

url = "https://modelslab.com/api/v6/images/text2img"

payload = json.dumps({
    "key": "your_api_key",
    "model_id": "realistic-vision-v6.0-b1-inpaint",
    "prompt": "ultra realistic close up portrait ((beautiful pale cyberpunk female with heavy black eyeliner)), blue eyes, shaved side haircut, hyper detail, cinematic lighting, magic neon, dark red city, Canon EOS R3, nikon, f/1.4, ISO 200, 1/160s, 8K, RAW, unedited, symmetrical balance, in-frame, 8K",
    "negative_prompt": "painting, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, deformed, ugly, blurry, bad anatomy, bad proportions, extra limbs, cloned face, skinny, glitchy, double torso, extra arms, extra hands, mangled fingers, missing lips, ugly face, distorted face, extra legs, anime",
    "width": "512",
    "height": "512",
    "samples": "1",
    "num_inference_steps": "30",
    "safety_checker": "no",
    "enhance_prompt": "yes",
    "seed": None,
    "guidance_scale": 7.5,
    "multi_lingual": "no",
    "panorama": "no",
    "self_attention": "no",
    "upscale": "no",
    "embeddings": "embeddings_model_id",
    "lora": "lora_model_id",
    "webhook": None,
    "track_id": None
})

headers = {
    "Content-Type": "application/json"
}

response = requests.request("POST", url, headers=headers, data=payload)
print(response.text)

Funcionalidades

Generación texto-a-imagen con estilo ultra realista.
Soporte para inpainting dentro de la familia Realistic Vision v6.0 B1.
Formato Safetensors y compatibilidad con pipelines de Diffusers.
Ejemplos de inferencia local con DiffusionPipeline.
Integración por API a través de ModelsLab usando model_id realistic-vision-v6.0-b1-inpaint.
Parámetros configurables como prompt negativo, tamaño, pasos de inferencia, seed, guidance scale, embeddings y LoRA.

Casos de uso

Crear imágenes fotorrealistas a partir de prompts descriptivos.
Generar retratos cinematográficos con iluminación, cámara y detalles técnicos especificados en el prompt.
Editar o completar imágenes mediante flujos de inpainting compatibles con Realistic Vision.
Probar inferencia local con Diffusers en GPU CUDA o dispositivos Apple usando MPS.
Integrar generación de imágenes en aplicaciones mediante la API de ModelsLab.