QuantStack/Wan2.2-T2V-A14B-GGUF
QuantStack
Texto a video
Conversión directa en formato GGUF del modelo Wan-AI/Wan2.2-T2V-A14B para generación de video a partir de texto. Es una versión cuantizada de 14B parámetros con arquitectura Wan, pensada para ejecutarse en flujos locales como ComfyUI mediante el nodo ComfyUI-GGUF. Mantiene los términos de licencia y restricciones de uso del modelo original.
Como usar
El modelo se usa con el nodo personalizado ComfyUI-GGUF de city96 para ComfyUI. Los archivos del modelo deben colocarse en ComfyUI/models/unet; para la instalación completa se debe consultar el README del repositorio de ComfyUI-GGUF.
No se incluye ningún fragmento de código en la página proporcionada.
Funcionalidades
- Modelo texto-a-video en formato GGUF.
- Conversión cuantizada del modelo base Wan-AI/Wan2.2-T2V-A14B.
- 14B parámetros con arquitectura Wan.
- Licencia Apache 2.0, sujeta también a las condiciones del modelo original.
- Variantes de cuantización disponibles desde 2 bits hasta 8 bits, incluyendo Q2_K, Q3_K_S, Q3_K_M, Q4_K_S, Q4_0, Q4_1, Q4_K_M, Q5_K_S, Q5_0, Q5_1, Q5_K_M, Q6_K y Q8_0.
- Tamaños de archivo aproximados entre 5.3 GB y 15.4 GB según la cuantización.
- No está desplegado actualmente en proveedores de inferencia de Hugging Face.
Casos de uso
- Generación local de video a partir de prompts de texto.
- Integración de Wan2.2-T2V-A14B en flujos de ComfyUI.
- Pruebas con distintas cuantizaciones GGUF para equilibrar memoria, tamaño y calidad.
- Experimentación con modelos texto-a-video de gran tamaño sin depender de proveedores de inferencia alojados.