city96/FastHunyuan-gguf

city96

Texto a video

Conversión directa a GGUF del modelo FastVideo/FastHunyuan para generación de video a partir de texto. Está pensada para usarse con los nodos nativos de HunyuanVideo en ComfyUI o con el nodo personalizado ComfyUI-GGUF. Al ser una versión cuantizada y no un ajuste fino, mantiene las restricciones y términos de licencia del modelo original de Tencent Hunyuan.

Como usar

Descarga los archivos GGUF del modelo y colócalos en ComfyUI/models/unet. Para usarlo correctamente en ComfyUI, consulta las instrucciones del repositorio de ComfyUI-GGUF. La VAE necesaria se descarga por separado desde el repositorio de Kijai mencionado en la página del modelo.

Funcionalidades

Modelo de texto a video cuantizado en formato GGUF.
Basado en FastVideo/FastHunyuan, con arquitectura hyvid y tamaño aproximado de 13B parámetros.
Compatible con ComfyUI HunyuanVideo y con el nodo personalizado ComfyUI-GGUF.
Incluye múltiples cuantizaciones: Q3, Q4, Q5, Q6, Q8 y BF16, con tamaños desde 6.09 GB hasta 25.6 GB.
No está desplegado en proveedores de inferencia de Hugging Face en la página indicada.

Casos de uso

Generación local de video a partir de texto usando ComfyUI.
Ejecución de FastHunyuan con menor consumo de memoria mediante cuantizaciones GGUF.
Pruebas de distintos niveles de cuantización para equilibrar tamaño, memoria y calidad visual.
Flujos de trabajo de video generativo basados en HunyuanVideo dentro de ComfyUI.