argmaxinc/mlx-stable-diffusion-3.5-large

argmaxinc

Texto a imagen

Versión para MLX de Stable Diffusion 3.5 Large preparada por Argmax para generación de imágenes a partir de texto en hardware compatible con MLX, pensada para ejecutarse localmente con DiffusionKit. Usa el modelo base stabilityai/stable-diffusion-3.5-large y está publicada con licencia stabilityai-ai-community.

Como usar

Uso con DiffusionKit:
# Pipeline for Stable Diffusion 3
from diffusionkit.mlx import DiffusionPipeline

pipeline = DiffusionPipeline(
    shift=3.0,
    use_t5=False,
    model_version="argmaxinc/mlx-stable-diffusion-3.5-large",
    low_memory_mode=True,
    a16=True,
    w16=True,
)

# Image Generation
HEIGHT = 512
WIDTH = 512
NUM_STEPS = 50
CFG_WEIGHT = 5

image, _ = pipeline.generate_image(
    "a photo of a cat",
    cfg_weight=CFG_WEIGHT,
    num_steps=NUM_STEPS,
    latent_size=(HEIGHT // 8, WIDTH // 8),
)

Descarga con MLX/Hugging Face Hub:
# Download the model from the Hub
pip install huggingface_hub[hf_xet]
huggingface-cli download --local-dir mlx-stable-diffusion-3.5-large argmaxinc/mlx-stable-diffusion-3.5-large

Instalación y uso por CLI:
conda create -n diffusionkit python=3.11 -y
conda activate diffusionkit
pip install diffusionkit

diffusionkit-cli --prompt "detailed cinematic dof render of a \
 detailed MacBook Pro on a wooden desk in a dim room with items \
 around, messy dirty room. On the screen are the letters 'SD3 on \
 DiffusionKit' glowing softly. High detail hard surface render" \
 --model-version argmaxinc/mlx-stable-diffusion-3.5-large \
 --height 768 \
 --width 1360 \
 --seed 1001 \
 --step 50 \
 --cfg 7 \
 --t5 \
 --output ~/Desktop/sd3_on_mac.png

Funcionalidades

Generación de imágenes a partir de texto con Stable Diffusion 3.5 Large.
Compatibilidad con DiffusionKit y MLX para ejecución local.
Soporte de configuración de tamaño de imagen, pasos de inferencia, CFG, semilla y uso de T5 desde CLI.
Modo de baja memoria y pesos/activaciones en 16 bits en el ejemplo de DiffusionKit.
Modelo cuantizado MLX con tamaño aproximado de 16.5 GB.

Casos de uso

Crear imágenes desde prompts de texto en equipos Apple/entornos compatibles con MLX.
Probar Stable Diffusion 3.5 Large localmente con DiffusionKit sin depender de un proveedor de inferencia alojado.
Generar renders o imágenes personalizadas controlando resolución, semilla, pasos y escala CFG.
Integrar generación de imágenes en scripts Python mediante diffusionkit.mlx.