calcuis/hunyuan-gguf

calcuis

Texto a video

Versión cuantizada en formato GGUF de HunyuanVideo para generación de texto a video, preparada para usarse con ComfyUI y el paquete gguf-comfy. El modelo deriva de Comfy-Org/HunyuanVideo_repackaged y ofrece múltiples cuantizaciones para equilibrar tamaño, memoria y calidad.

Como usar

Instalación indicada en la tarjeta del modelo: colocar hunyuan-video-t2v-720p-q4_0.gguf en ./ComfyUI/models/unet, clip_l.safetensors y llava_llama3_fp8_scaled.safetensors en ./ComfyUI/models/text_encoders, y hunyuan_video_vae_bf16.safetensors en ./ComfyUI/models/vae. Para ejecutarlo sin instalación manual, se indica usar el archivo .bat del directorio principal del paquete gguf-comfy y arrastrar el workflow JSON al navegador. Ejemplo de prompt incluido:
anime style anime girl with massive fennec ears and one big fluffy tail, she has blonde hair long hair blue eyes wearing a pink sweater and a long blue skirt walking in a beautiful outdoor scenery with snow mountains in the background

Funcionalidades

Modelo de texto a video basado en HunyuanVideo.
Distribuido en formato GGUF para flujos de trabajo de ComfyUI.
Modelo de 13B parámetros con arquitectura hyvid.
Incluye cuantizaciones de 3, 4, 5, 6, 8 y 16 bits, desde Q3_K_S de 6.09 GB hasta BF16 de 25.6 GB.
Licencia tencent-hunyuan-community.
No está desplegado actualmente en proveedores de inferencia de Hugging Face.

Casos de uso

Generar videos a partir de descripciones de texto en ComfyUI.
Ejecutar HunyuanVideo con variantes cuantizadas GGUF para reducir requisitos de almacenamiento o memoria.
Probar workflows de texto a video con GGUF o safetensors dentro de ComfyUI.
Crear escenas animadas o estilizadas a partir de prompts detallados.