city96/HunyuanVideo-gguf

city96
Texto a video

Conversión directa a GGUF del modelo tencent/HunyuanVideo para generación de video a partir de texto. Está pensada para usarse con los nodos nativos integrados de HunyuanVideo en ComfyUI o con el nodo personalizado ComfyUI-GGUF. No es un ajuste fino, sino una versión cuantizada, por lo que conserva las restricciones y términos de licencia del modelo original.

Como usar

Descarga los archivos GGUF del modelo y colócalos en ComfyUI/models/unet. Para completar la configuración, usa los nodos nativos de HunyuanVideo en ComfyUI o instala el nodo personalizado ComfyUI-GGUF. La VAE necesaria se indica como disponible en un repositorio separado de Kijai; conviene consultar el README de GitHub del nodo para las instrucciones completas de instalación.

Funcionalidades

Modelo de texto a video basado en HunyuanVideo.
Conversión GGUF cuantizada del modelo base tencent/HunyuanVideo.
Compatible con ComfyUI mediante los nodos nativos de HunyuanVideo.
También puede usarse con el nodo personalizado ComfyUI-GGUF.
Arquitectura hyvid con tamaño de 13B parámetros.
Incluye múltiples variantes de cuantización: 3-bit, 4-bit, 5-bit, 6-bit, 8-bit y BF16.
Los tamaños de archivo van aproximadamente de 6.09 GB en Q3_K_S a 25.6 GB en BF16.
No está desplegado actualmente en proveedores de inferencia de Hugging Face.

Casos de uso

Generar videos a partir de prompts de texto dentro de flujos de trabajo de ComfyUI.
Ejecutar HunyuanVideo localmente con variantes cuantizadas para reducir el consumo de memoria frente a BF16.
Probar distintas cuantizaciones GGUF según el equilibrio deseado entre tamaño, rendimiento y calidad.
Crear pipelines visuales de texto a video usando nodos de ComfyUI.