QuantStack/Wan2.2-T2V-A14B-GGUF

QuantStack

Texto a video

Conversión directa en formato GGUF del modelo Wan-AI/Wan2.2-T2V-A14B para generación de video a partir de texto. Es una versión cuantizada de 14B parámetros con arquitectura Wan, pensada para ejecutarse en flujos locales como ComfyUI mediante el nodo ComfyUI-GGUF. Mantiene los términos de licencia y restricciones de uso del modelo original.

Como usar

El modelo se usa con el nodo personalizado ComfyUI-GGUF de city96 para ComfyUI. Los archivos del modelo deben colocarse en ComfyUI/models/unet; para la instalación completa se debe consultar el README del repositorio de ComfyUI-GGUF.
No se incluye ningún fragmento de código en la página proporcionada.

Funcionalidades

Modelo texto-a-video en formato GGUF.
Conversión cuantizada del modelo base Wan-AI/Wan2.2-T2V-A14B.
14B parámetros con arquitectura Wan.
Licencia Apache 2.0, sujeta también a las condiciones del modelo original.
Variantes de cuantización disponibles desde 2 bits hasta 8 bits, incluyendo Q2_K, Q3_K_S, Q3_K_M, Q4_K_S, Q4_0, Q4_1, Q4_K_M, Q5_K_S, Q5_0, Q5_1, Q5_K_M, Q6_K y Q8_0.
Tamaños de archivo aproximados entre 5.3 GB y 15.4 GB según la cuantización.
No está desplegado actualmente en proveedores de inferencia de Hugging Face.

Casos de uso

Generación local de video a partir de prompts de texto.
Integración de Wan2.2-T2V-A14B en flujos de ComfyUI.
Pruebas con distintas cuantizaciones GGUF para equilibrar memoria, tamaño y calidad.
Experimentación con modelos texto-a-video de gran tamaño sin depender de proveedores de inferencia alojados.