city96/HunyuanVideo-gguf
city96
Texto a video
Conversión directa a GGUF del modelo tencent/HunyuanVideo para generación de video a partir de texto. Está pensada para usarse con los nodos nativos integrados de HunyuanVideo en ComfyUI o con el nodo personalizado ComfyUI-GGUF. No es un ajuste fino, sino una versión cuantizada, por lo que conserva las restricciones y términos de licencia del modelo original.
Como usar
Descarga los archivos GGUF del modelo y colócalos en ComfyUI/models/unet. Para completar la configuración, usa los nodos nativos de HunyuanVideo en ComfyUI o instala el nodo personalizado ComfyUI-GGUF. La VAE necesaria se indica como disponible en un repositorio separado de Kijai; conviene consultar el README de GitHub del nodo para las instrucciones completas de instalación.
Funcionalidades
- Modelo de texto a video basado en HunyuanVideo.
- Conversión GGUF cuantizada del modelo base tencent/HunyuanVideo.
- Compatible con ComfyUI mediante los nodos nativos de HunyuanVideo.
- También puede usarse con el nodo personalizado ComfyUI-GGUF.
- Arquitectura hyvid con tamaño de 13B parámetros.
- Incluye múltiples variantes de cuantización: 3-bit, 4-bit, 5-bit, 6-bit, 8-bit y BF16.
- Los tamaños de archivo van aproximadamente de 6.09 GB en Q3_K_S a 25.6 GB en BF16.
- No está desplegado actualmente en proveedores de inferencia de Hugging Face.
Casos de uso
- Generar videos a partir de prompts de texto dentro de flujos de trabajo de ComfyUI.
- Ejecutar HunyuanVideo localmente con variantes cuantizadas para reducir el consumo de memoria frente a BF16.
- Probar distintas cuantizaciones GGUF según el equilibrio deseado entre tamaño, rendimiento y calidad.
- Crear pipelines visuales de texto a video usando nodos de ComfyUI.