Dxf3316/Wan2.2-T2V-A14B-GGUF

Dxf3316

Texto a video

Conversión directa en formato GGUF del modelo Wan-AI/Wan2.2-T2V-A14B para generación de vídeo a partir de texto. Es una versión cuantizada de arquitectura Wan con 14B parámetros, publicada bajo Apache 2.0 y sujeta a los términos y restricciones del modelo original.

Como usar

El modelo se usa con el nodo personalizado ComfyUI-GGUF para ComfyUI. Los archivos del modelo deben colocarse en ComfyUI/models/unet; para completar la instalación hay que seguir las instrucciones del README del repositorio de ComfyUI-GGUF.

Funcionalidades

Modelo de texto a vídeo en formato GGUF.
Conversión cuantizada directa de Wan-AI/Wan2.2-T2V-A14B.
Arquitectura Wan con 14B parámetros.
Variantes de cuantización disponibles desde 2 bits hasta 8 bits, incluyendo Q2_K, Q3_K_S, Q3_K_M, Q4_K_S, Q4_0, Q4_1, Q4_K_M, Q5_K_S, Q5_0, Q5_1, Q5_K_M, Q6_K y Q8_0.
Tamaños de archivo aproximados entre 5.3 GB y 15.4 GB según la cuantización.
Pensado para uso local con ComfyUI mediante el nodo personalizado ComfyUI-GGUF de city96.

Casos de uso

Generación local de vídeos a partir de prompts de texto.
Ejecución de Wan2.2-T2V-A14B en entornos compatibles con GGUF y ComfyUI.
Pruebas con distintas cuantizaciones para equilibrar tamaño, memoria y calidad de generación.