QuantStack/Wan2.2-TI2V-5B-GGUF
QuantStack
Texto a video
Conversión directa a formato GGUF del modelo Wan-AI/Wan2.2-TI2V-5B, orientada a generación de texto a video y TI2V. Es una variante cuantizada de 5B parámetros de la arquitectura Wan, por lo que conserva los términos de licencia y restricciones de uso del modelo original.
Como usar
El modelo se usa con el nodo personalizado ComfyUI-GGUF para ComfyUI. Los archivos del modelo deben colocarse en ComfyUI/models/unet. Para la instalación completa, se debe seguir el README del repositorio de GitHub del nodo ComfyUI-GGUF.
Funcionalidades
- Modelo de texto a video en formato GGUF.
- Conversión cuantizada del modelo base Wan-AI/Wan2.2-TI2V-5B.
- Arquitectura Wan con 5B parámetros.
- Disponible en múltiples cuantizaciones: 2-bit, 3-bit, 4-bit, 5-bit, 6-bit y 8-bit.
- Archivos con tamaños aproximados entre 1.85 GB y 5.4 GB según la cuantización.
- Compatible con flujos de ComfyUI mediante el nodo personalizado ComfyUI-GGUF de city96.
- No está desplegado actualmente por proveedores de inferencia en Hugging Face.
Casos de uso
- Generación de video a partir de texto en entornos locales con ComfyUI.
- Ejecución de Wan2.2-TI2V-5B en formato GGUF con menor huella de memoria mediante cuantización.
- Pruebas comparativas entre distintos niveles de cuantización para equilibrar tamaño, rendimiento y calidad visual.
- Integración en flujos de trabajo de video generativo basados en nodos.