Dxf3316/Wan2.2-T2V-A14B-GGUF
Dxf3316
Texto a video
Conversión directa en formato GGUF del modelo Wan-AI/Wan2.2-T2V-A14B para generación de vídeo a partir de texto. Es una versión cuantizada de arquitectura Wan con 14B parámetros, publicada bajo Apache 2.0 y sujeta a los términos y restricciones del modelo original.
Como usar
El modelo se usa con el nodo personalizado ComfyUI-GGUF para ComfyUI. Los archivos del modelo deben colocarse en ComfyUI/models/unet; para completar la instalación hay que seguir las instrucciones del README del repositorio de ComfyUI-GGUF.
Funcionalidades
- Modelo de texto a vídeo en formato GGUF.
- Conversión cuantizada directa de Wan-AI/Wan2.2-T2V-A14B.
- Arquitectura Wan con 14B parámetros.
- Variantes de cuantización disponibles desde 2 bits hasta 8 bits, incluyendo Q2_K, Q3_K_S, Q3_K_M, Q4_K_S, Q4_0, Q4_1, Q4_K_M, Q5_K_S, Q5_0, Q5_1, Q5_K_M, Q6_K y Q8_0.
- Tamaños de archivo aproximados entre 5.3 GB y 15.4 GB según la cuantización.
- Pensado para uso local con ComfyUI mediante el nodo personalizado ComfyUI-GGUF de city96.
Casos de uso
- Generación local de vídeos a partir de prompts de texto.
- Ejecución de Wan2.2-T2V-A14B en entornos compatibles con GGUF y ComfyUI.
- Pruebas con distintas cuantizaciones para equilibrar tamaño, memoria y calidad de generación.