squirrelae/Wan2.2-TI2V-5B-GGUF
squirrelae
Texto a video
Conversión directa en formato GGUF del modelo Wan-AI/Wan2.2-TI2V-5B para generación de video a partir de texto e imagen/texto-video. Es una versión cuantizada de 5B parámetros con arquitectura Wan, pensada para ejecutarse en flujos locales como ComfyUI mediante nodos compatibles con GGUF. Mantiene la licencia Apache 2.0 y las restricciones de uso del modelo original.
Como usar
El modelo puede usarse con el nodo personalizado ComfyUI-GGUF para ComfyUI. Los archivos del modelo deben colocarse en ComfyUI/models/unet; para la instalación completa se debe seguir el README del repositorio de ComfyUI-GGUF. No se incluye ningún snippet de código en la página proporcionada.
Funcionalidades
- Modelo de texto a video en formato GGUF.
- Conversión cuantizada del modelo base Wan-AI/Wan2.2-TI2V-5B.
- Tamaño de modelo de 5B parámetros con arquitectura Wan.
- Disponible en varias cuantizaciones: Q2_K, Q3_K_S, Q3_K_M, Q4_K_S, Q4_0, Q4_1, Q4_K_M, Q5_K_S, Q5_0, Q5_1, Q5_K_M, Q6_K y Q8_0.
- Archivos desde aproximadamente 1,85 GB hasta 5,4 GB según la cuantización.
- Compatible con ComfyUI usando el nodo personalizado ComfyUI-GGUF de city96.
Casos de uso
- Generación local de video a partir de prompts de texto.
- Flujos de trabajo de texto a video dentro de ComfyUI.
- Experimentación con versiones cuantizadas de Wan2.2-TI2V-5B para reducir tamaño de descarga y requisitos de memoria.
- Pruebas comparativas entre cuantizaciones GGUF de 2, 3, 4, 5, 6 y 8 bits.