Shaunnotshwn/SkyReels-V2-T2V-14B-540P-GGUF

Shaunnotshwn
Texto a video

Conversión directa en formato GGUF del modelo Skywork/SkyReels-V2-T2V-14B-540P, un modelo de 14B parámetros para generación de video a partir de texto. Esta versión ofrece cuantizaciones GGUF creadas desde el archivo base FP32 para facilitar su uso local, especialmente con ComfyUI mediante el nodo personalizado ComfyUI-GGUF.

Como usar

Descarga los archivos GGUF del modelo y colócalos en ComfyUI/models/unet. Para usarlo se requiere el nodo personalizado ComfyUI-GGUF y seguir las instrucciones del README de ese proyecto. La VAE debe descargarse desde el repositorio mencionado de Kijai.

Funcionalidades

Modelo text-to-video de 14B parámetros basado en Skywork/SkyReels-V2-T2V-14B-540P.
Conversión GGUF directa orientada a ejecución local y flujos de ComfyUI.
Cuantizaciones disponibles desde 3 bits hasta 8 bits, incluyendo Q3_K_S, Q4_K_M, Q5_K_M, Q6_K y Q8_0.
Tamaños de archivo publicados que van aproximadamente de 6.52 GB en Q3_K_S a 15.4 GB en Q8_0; F16/BF16 indicados como disponibles bajo petición.
Arquitectura indicada como wan.
No está desplegado actualmente en proveedores de inferencia de Hugging Face.

Casos de uso

Generación local de video a partir de prompts de texto.
Experimentación con SkyReels-V2-T2V-14B-540P en ComfyUI usando pesos cuantizados.
Comparación de calidad, memoria y rendimiento entre cuantizaciones GGUF de 3, 4, 5, 6 y 8 bits.
Flujos creativos de video donde se necesita reducir el tamaño del modelo frente a pesos FP16/BF16.