QuantStack/Wan2.2-Fun-A14B-InP-GGUF

QuantStack
Texto a video

Conversión directa en formato GGUF cuantizado del modelo alibaba-pai/Wan2.2-Fun-A14B-InP, basado en Wan2.2-I2V-A14B. Está orientado a generación de video a partir de texto o flujos de ComfyUI, con soporte para inglés y chino. Al ser una versión cuantizada, mantiene los términos de licencia y restricciones de uso del modelo original bajo Apache 2.0.

Como usar

Usar con ComfyUI y el nodo personalizado ComfyUI-GGUF de city96. Colocar los archivos del modelo principal en ComfyUI/models/unet. El codificador de texto Umt5-xxl debe ir en ComfyUI/models/text_encoders y el VAE Wan2.1_VAE.safetensors en ComfyUI/models/vae. Consultar el README de GitHub del nodo para completar la instalación.

Funcionalidades

Modelo de texto a video en formato GGUF.
Arquitectura Wan con 14B parámetros.
Conversión cuantizada de alibaba-pai/Wan2.2-Fun-A14B-InP.
Compatible con ComfyUI mediante el nodo personalizado ComfyUI-GGUF de city96.
Incluye varias cuantizaciones: Q2_K, Q3_K_S, Q3_K_M, Q4_K_S, Q4_0, Q4_1, Q4_K_M, Q5_K_S, Q5_0, Q5_1, Q5_K_M, Q6_K y Q8_0.
Tamaños aproximados desde 5.31 GB en 2 bits hasta 15.4 GB en 8 bits.
Requiere componentes externos: codificador de texto Umt5-xxl y VAE Wan2.1_VAE.safetensors.

Casos de uso

Generación de video con flujos locales en ComfyUI.
Experimentación con Wan2.2-Fun-A14B-InP en hardware con menos memoria usando cuantizaciones GGUF.
Producción de videos generativos a partir de prompts en inglés o chino.
Uso en pipelines locales donde se prefieren pesos cuantizados frente a versiones safetensors completas.