squirrelae/Wan2.2-TI2V-5B-GGUF

squirrelae

Texto a video

Conversión directa en formato GGUF del modelo Wan-AI/Wan2.2-TI2V-5B para generación de video a partir de texto e imagen/texto-video. Es una versión cuantizada de 5B parámetros con arquitectura Wan, pensada para ejecutarse en flujos locales como ComfyUI mediante nodos compatibles con GGUF. Mantiene la licencia Apache 2.0 y las restricciones de uso del modelo original.

Como usar

El modelo puede usarse con el nodo personalizado ComfyUI-GGUF para ComfyUI. Los archivos del modelo deben colocarse en ComfyUI/models/unet; para la instalación completa se debe seguir el README del repositorio de ComfyUI-GGUF. No se incluye ningún snippet de código en la página proporcionada.

Funcionalidades

Modelo de texto a video en formato GGUF.
Conversión cuantizada del modelo base Wan-AI/Wan2.2-TI2V-5B.
Tamaño de modelo de 5B parámetros con arquitectura Wan.
Disponible en varias cuantizaciones: Q2_K, Q3_K_S, Q3_K_M, Q4_K_S, Q4_0, Q4_1, Q4_K_M, Q5_K_S, Q5_0, Q5_1, Q5_K_M, Q6_K y Q8_0.
Archivos desde aproximadamente 1,85 GB hasta 5,4 GB según la cuantización.
Compatible con ComfyUI usando el nodo personalizado ComfyUI-GGUF de city96.

Casos de uso

Generación local de video a partir de prompts de texto.
Flujos de trabajo de texto a video dentro de ComfyUI.
Experimentación con versiones cuantizadas de Wan2.2-TI2V-5B para reducir tamaño de descarga y requisitos de memoria.
Pruebas comparativas entre cuantizaciones GGUF de 2, 3, 4, 5, 6 y 8 bits.