calcuis/hunyuan-gguf
calcuis
Texto a video
Versión cuantizada en formato GGUF de HunyuanVideo para generación de texto a video, preparada para usarse con ComfyUI y el paquete gguf-comfy. El modelo deriva de Comfy-Org/HunyuanVideo_repackaged y ofrece múltiples cuantizaciones para equilibrar tamaño, memoria y calidad.
Como usar
Instalación indicada en la tarjeta del modelo: colocar hunyuan-video-t2v-720p-q4_0.gguf en ./ComfyUI/models/unet, clip_l.safetensors y llava_llama3_fp8_scaled.safetensors en ./ComfyUI/models/text_encoders, y hunyuan_video_vae_bf16.safetensors en ./ComfyUI/models/vae. Para ejecutarlo sin instalación manual, se indica usar el archivo .bat del directorio principal del paquete gguf-comfy y arrastrar el workflow JSON al navegador. Ejemplo de prompt incluido:
anime style anime girl with massive fennec ears and one big fluffy tail, she has blonde hair long hair blue eyes wearing a pink sweater and a long blue skirt walking in a beautiful outdoor scenery with snow mountains in the background
Funcionalidades
- Modelo de texto a video basado en HunyuanVideo.
- Distribuido en formato GGUF para flujos de trabajo de ComfyUI.
- Modelo de 13B parámetros con arquitectura hyvid.
- Incluye cuantizaciones de 3, 4, 5, 6, 8 y 16 bits, desde Q3_K_S de 6.09 GB hasta BF16 de 25.6 GB.
- Licencia tencent-hunyuan-community.
- No está desplegado actualmente en proveedores de inferencia de Hugging Face.
Casos de uso
- Generar videos a partir de descripciones de texto en ComfyUI.
- Ejecutar HunyuanVideo con variantes cuantizadas GGUF para reducir requisitos de almacenamiento o memoria.
- Probar workflows de texto a video con GGUF o safetensors dentro de ComfyUI.
- Crear escenas animadas o estilizadas a partir de prompts detallados.