stablediffusionapi/majicmixrealistic

stablediffusionapi

Texto a imagen

majicMIX_realistic es un modelo de generación de imágenes texto-a-imagen basado en Stable Diffusion, orientado a producir retratos e imágenes ultra realistas. Está publicado en Hugging Face por Stable Diffusion API y se puede usar con Diffusers o mediante la API DreamBooth de StableDiffusionAPI/ModelsLab usando el identificador `majicmixrealistic`.

Como usar

Instalación y uso con Diffusers:
pip install -U diffusers transformers accelerate

import torch
from diffusers import DiffusionPipeline

# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained("stablediffusionapi/majicmixrealistic", dtype=torch.bfloat16, device_map="cuda")

prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]

Uso mediante API DreamBooth de StableDiffusionAPI/ModelsLab:
import requests
import json

url = "https://stablediffusionapi.com/api/v3/dreambooth"

payload = json.dumps({
  "key": "",
  "model_id": "majicmixrealistic",
  "prompt": "actual 8K portrait photo of gareth person, portrait, happy colors, bright eyes, clear eyes, warm smile, smooth soft skin, big dreamy eyes, beautiful intricate colored hair, symmetrical, anime wide eyes, soft lighting, detailed face, by makoto shinkai, stanley artgerm lau, wlop, rossdraws, concept art, digital painting, looking into camera",
  "negative_prompt": "painting, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, deformed, ugly, blurry, bad anatomy, bad proportions, extra limbs, cloned face, skinny, glitchy, double torso, extra arms, extra hands, mangled fingers, missing lips, ugly face, distorted face, extra legs, anime",
  "width": "512",
  "height": "512",
  "samples": "1",
  "num_inference_steps": "30",
  "safety_checker": "no",
  "enhance_prompt": "yes",
  "seed": None,
  "guidance_scale": 7.5,
  "multi_lingual": "no",
  "panorama": "no",
  "self_attention": "no",
  "upscale": "no",
  "embeddings": "embeddings_model_id",
  "lora": "lora_model_id",
  "webhook": None,
  "track_id": None
})

headers = {
  'Content-Type': 'application/json'
}

response = requests.request("POST", url, headers=headers, data=payload)
print(response.text)

Funcionalidades

Generación texto-a-imagen con `StableDiffusionPipeline`/Diffusers.
Enfoque en resultados ultra realistas, especialmente retratos detallados.
Compatible con ejecución local mediante Diffusers y con aplicaciones como Draw Things y DiffusionBee.
Disponible para inferencia vía API externa de StableDiffusionAPI/ModelsLab.
Permite parámetros habituales de generación como prompt negativo, tamaño, pasos de inferencia, semilla, escala de guía, embeddings y LoRA.
Licencia `creativeml-openrail-m`.

Casos de uso

Crear retratos realistas a partir de descripciones textuales.
Generar imágenes detalladas de personajes, conceptos visuales o escenas fotográficas.
Prototipar flujos texto-a-imagen en Python con Diffusers.
Integrar generación de imágenes en aplicaciones usando la API DreamBooth externa.
Experimentar con prompts negativos, embeddings y LoRA para controlar el estilo y la anatomía.