argmaxinc/mlx-stable-diffusion-3.5-large
argmaxinc
Texto a imagen
Versión para MLX de Stable Diffusion 3.5 Large preparada por Argmax para generación de imágenes a partir de texto en hardware compatible con MLX, pensada para ejecutarse localmente con DiffusionKit. Usa el modelo base stabilityai/stable-diffusion-3.5-large y está publicada con licencia stabilityai-ai-community.
Como usar
Uso con DiffusionKit:
# Pipeline for Stable Diffusion 3
from diffusionkit.mlx import DiffusionPipeline
pipeline = DiffusionPipeline(
shift=3.0,
use_t5=False,
model_version="argmaxinc/mlx-stable-diffusion-3.5-large",
low_memory_mode=True,
a16=True,
w16=True,
)
# Image Generation
HEIGHT = 512
WIDTH = 512
NUM_STEPS = 50
CFG_WEIGHT = 5
image, _ = pipeline.generate_image(
"a photo of a cat",
cfg_weight=CFG_WEIGHT,
num_steps=NUM_STEPS,
latent_size=(HEIGHT // 8, WIDTH // 8),
)
Descarga con MLX/Hugging Face Hub:
# Download the model from the Hub
pip install huggingface_hub[hf_xet]
huggingface-cli download --local-dir mlx-stable-diffusion-3.5-large argmaxinc/mlx-stable-diffusion-3.5-large
Instalación y uso por CLI:
conda create -n diffusionkit python=3.11 -y
conda activate diffusionkit
pip install diffusionkit
diffusionkit-cli --prompt "detailed cinematic dof render of a \
detailed MacBook Pro on a wooden desk in a dim room with items \
around, messy dirty room. On the screen are the letters 'SD3 on \
DiffusionKit' glowing softly. High detail hard surface render" \
--model-version argmaxinc/mlx-stable-diffusion-3.5-large \
--height 768 \
--width 1360 \
--seed 1001 \
--step 50 \
--cfg 7 \
--t5 \
--output ~/Desktop/sd3_on_mac.png
Funcionalidades
- Generación de imágenes a partir de texto con Stable Diffusion 3.5 Large.
- Compatibilidad con DiffusionKit y MLX para ejecución local.
- Soporte de configuración de tamaño de imagen, pasos de inferencia, CFG, semilla y uso de T5 desde CLI.
- Modo de baja memoria y pesos/activaciones en 16 bits en el ejemplo de DiffusionKit.
- Modelo cuantizado MLX con tamaño aproximado de 16.5 GB.
Casos de uso
- Crear imágenes desde prompts de texto en equipos Apple/entornos compatibles con MLX.
- Probar Stable Diffusion 3.5 Large localmente con DiffusionKit sin depender de un proveedor de inferencia alojado.
- Generar renders o imágenes personalizadas controlando resolución, semilla, pasos y escala CFG.
- Integrar generación de imágenes en scripts Python mediante diffusionkit.mlx.