QuantStack/Wan2.2-TI2V-5B-GGUF

QuantStack

Texto a video

Conversión directa a formato GGUF del modelo Wan-AI/Wan2.2-TI2V-5B, orientada a generación de texto a video y TI2V. Es una variante cuantizada de 5B parámetros de la arquitectura Wan, por lo que conserva los términos de licencia y restricciones de uso del modelo original.

Como usar

El modelo se usa con el nodo personalizado ComfyUI-GGUF para ComfyUI. Los archivos del modelo deben colocarse en ComfyUI/models/unet. Para la instalación completa, se debe seguir el README del repositorio de GitHub del nodo ComfyUI-GGUF.

Funcionalidades

Modelo de texto a video en formato GGUF.
Conversión cuantizada del modelo base Wan-AI/Wan2.2-TI2V-5B.
Arquitectura Wan con 5B parámetros.
Disponible en múltiples cuantizaciones: 2-bit, 3-bit, 4-bit, 5-bit, 6-bit y 8-bit.
Archivos con tamaños aproximados entre 1.85 GB y 5.4 GB según la cuantización.
Compatible con flujos de ComfyUI mediante el nodo personalizado ComfyUI-GGUF de city96.
No está desplegado actualmente por proveedores de inferencia en Hugging Face.

Casos de uso

Generación de video a partir de texto en entornos locales con ComfyUI.
Ejecución de Wan2.2-TI2V-5B en formato GGUF con menor huella de memoria mediante cuantización.
Pruebas comparativas entre distintos niveles de cuantización para equilibrar tamaño, rendimiento y calidad visual.
Integración en flujos de trabajo de video generativo basados en nodos.