argmaxinc/mlx-stable-diffusion-3-medium
argmaxinc
Texto a imagen
Versión MLX cuantizada de Stable Diffusion 3 Medium para generación de imágenes a partir de texto en dispositivos Apple mediante DiffusionKit. Está basada en `stabilityai/stable-diffusion-3-medium-diffusers` y está orientada a ejecución local con aceleración MLX.
Como usar
Instala DiffusionKit en un entorno Conda y ejecuta la CLI indicando el prompt, la versión del modelo y los parámetros de generación.
conda create -n diffusionkit python=3.11 -y
conda activate diffusionkit
pip install diffusionkit
diffusionkit-cli --prompt "detailed cinematic dof render of a \ detailed MacBook Pro on a wooden desk in a dim room with items \ around, messy dirty room. On the screen are the letters 'SD3 on \ DiffusionKit' glowing softly. High detail hard surface render" \
--model-version argmaxinc/mlx-stable-diffusion-3-medium \
--height 768 \
--width 1360 \
--seed 1001 \
--step 50 \
--cfg 7 \
--output ~/Desktop/sd3_on_mac.png
Funcionalidades
- Generación de imágenes desde texto
- Implementación sobre DiffusionKit
- Optimizada para MLX en hardware Apple
- Modelo cuantizado
- Basado en Stable Diffusion 3 Medium
- Formato listo para inferencia local por CLI
Casos de uso
- Crear imágenes detalladas a partir de prompts de texto
- Generar renders cinematográficos y escenas con alto nivel de detalle
- Probar Stable Diffusion 3 Medium localmente en equipos Apple
- Integrar flujos de generación visual con DiffusionKit