argmaxinc/mlx-stable-diffusion-3-medium

argmaxinc

Texto a imagen

Versión MLX cuantizada de Stable Diffusion 3 Medium para generación de imágenes a partir de texto en dispositivos Apple mediante DiffusionKit. Está basada en `stabilityai/stable-diffusion-3-medium-diffusers` y está orientada a ejecución local con aceleración MLX.

Como usar

Instala DiffusionKit en un entorno Conda y ejecuta la CLI indicando el prompt, la versión del modelo y los parámetros de generación.
conda create -n diffusionkit python=3.11 -y
conda activate diffusionkit
pip install diffusionkit

diffusionkit-cli --prompt "detailed cinematic dof render of a \ detailed MacBook Pro on a wooden desk in a dim room with items \ around, messy dirty room. On the screen are the letters 'SD3 on \ DiffusionKit' glowing softly. High detail hard surface render" \
  --model-version argmaxinc/mlx-stable-diffusion-3-medium \
  --height 768 \
  --width 1360 \
  --seed 1001 \
  --step 50 \
  --cfg 7 \
  --output ~/Desktop/sd3_on_mac.png

Funcionalidades

Generación de imágenes desde texto
Implementación sobre DiffusionKit
Optimizada para MLX en hardware Apple
Modelo cuantizado
Basado en Stable Diffusion 3 Medium
Formato listo para inferencia local por CLI

Casos de uso

Crear imágenes detalladas a partir de prompts de texto
Generar renders cinematográficos y escenas con alto nivel de detalle
Probar Stable Diffusion 3 Medium localmente en equipos Apple
Integrar flujos de generación visual con DiffusionKit