Shaunnotshwn/SkyReels-V2-T2V-14B-540P-GGUF
Shaunnotshwn
Texto a video
Conversión directa en formato GGUF del modelo Skywork/SkyReels-V2-T2V-14B-540P, un modelo de 14B parámetros para generación de video a partir de texto. Esta versión ofrece cuantizaciones GGUF creadas desde el archivo base FP32 para facilitar su uso local, especialmente con ComfyUI mediante el nodo personalizado ComfyUI-GGUF.
Como usar
Descarga los archivos GGUF del modelo y colócalos en ComfyUI/models/unet. Para usarlo se requiere el nodo personalizado ComfyUI-GGUF y seguir las instrucciones del README de ese proyecto. La VAE debe descargarse desde el repositorio mencionado de Kijai.
Funcionalidades
- Modelo text-to-video de 14B parámetros basado en Skywork/SkyReels-V2-T2V-14B-540P.
- Conversión GGUF directa orientada a ejecución local y flujos de ComfyUI.
- Cuantizaciones disponibles desde 3 bits hasta 8 bits, incluyendo Q3_K_S, Q4_K_M, Q5_K_M, Q6_K y Q8_0.
- Tamaños de archivo publicados que van aproximadamente de 6.52 GB en Q3_K_S a 15.4 GB en Q8_0; F16/BF16 indicados como disponibles bajo petición.
- Arquitectura indicada como wan.
- No está desplegado actualmente en proveedores de inferencia de Hugging Face.
Casos de uso
- Generación local de video a partir de prompts de texto.
- Experimentación con SkyReels-V2-T2V-14B-540P en ComfyUI usando pesos cuantizados.
- Comparación de calidad, memoria y rendimiento entre cuantizaciones GGUF de 3, 4, 5, 6 y 8 bits.
- Flujos creativos de video donde se necesita reducir el tamaño del modelo frente a pesos FP16/BF16.