city96/FastHunyuan-gguf
city96
Texto a video
Conversión directa a GGUF del modelo FastVideo/FastHunyuan para generación de video a partir de texto. Está pensada para usarse con los nodos nativos de HunyuanVideo en ComfyUI o con el nodo personalizado ComfyUI-GGUF. Al ser una versión cuantizada y no un ajuste fino, mantiene las restricciones y términos de licencia del modelo original de Tencent Hunyuan.
Como usar
Descarga los archivos GGUF del modelo y colócalos en ComfyUI/models/unet. Para usarlo correctamente en ComfyUI, consulta las instrucciones del repositorio de ComfyUI-GGUF. La VAE necesaria se descarga por separado desde el repositorio de Kijai mencionado en la página del modelo.
Funcionalidades
- Modelo de texto a video cuantizado en formato GGUF.
- Basado en FastVideo/FastHunyuan, con arquitectura hyvid y tamaño aproximado de 13B parámetros.
- Compatible con ComfyUI HunyuanVideo y con el nodo personalizado ComfyUI-GGUF.
- Incluye múltiples cuantizaciones: Q3, Q4, Q5, Q6, Q8 y BF16, con tamaños desde 6.09 GB hasta 25.6 GB.
- No está desplegado en proveedores de inferencia de Hugging Face en la página indicada.
Casos de uso
- Generación local de video a partir de texto usando ComfyUI.
- Ejecución de FastHunyuan con menor consumo de memoria mediante cuantizaciones GGUF.
- Pruebas de distintos niveles de cuantización para equilibrar tamaño, memoria y calidad visual.
- Flujos de trabajo de video generativo basados en HunyuanVideo dentro de ComfyUI.