calcuis/hyvid

calcuis

Texto a video

Versión cuantizada GGUF y versión escalada FP8 de Hyvid/HunyuanVideo para generación de texto a video, preparada para flujos de ComfyUI y orientada a resultados de estilo anime mediante un adaptador LoRA. Está basada en tencent/HunyuanVideo y usa datasets de imágenes anime y descripciones anime.

Como usar

Configuración indicada por la tarjeta del modelo:
Arrastra hyvid_lora_adapter.safetensors [323MB] a ./ComfyUI/models/loras
Arrastra hunyuan-video-t2v-720p-q4_0.gguf [7.74GB] a ./ComfyUI/models/diffusion_models
Arrastra llava_llama3-q4_0.gguf [4.68GB] a ./ComfyUI/models/text_encoders
Arrastra clip_l_fp8_e4m3fn.safetensors [123MB] a ./ComfyUI/models/text_encoders
Arrastra hunyuan_video_vae_fp8_e4m3fn.safetensors [247MB] a ./ComfyUI/models/vae

Para ejecutarlo sin instalación adicional, la página indica usar el archivo .bat del directorio principal si se usa el paquete gguf-node, y después arrastrar el clip de demostración o el archivo JSON del workflow al navegador. La tarjeta enlaza workflows de ejemplo para GGUF y safetensors.

Funcionalidades

Generación de texto a video con arquitectura Hyvid de 13B parámetros.
Archivos GGUF cuantizados en varias precisiones, incluyendo Q3, Q4, Q5, Q6 y Q8, para reducir tamaño y acelerar la carga frente a pesos completos.
Incluye adaptador LoRA anime `hyvid_lora_adapter.safetensors` para mejorar salidas de estilo anime.
Incluye componentes recomendados para ComfyUI: modelo de difusión HunyuanVideo GGUF, codificador de texto LLaVA-Llama3 GGUF, CLIP FP8 y VAE FP8.
Soporta flujos de trabajo para GGUF y safetensors, con recomendación de la versión FP8 escalada para safetensors.
El autor reporta salida más estable cuando el adaptador se aplica correctamente, incluso con CLIP y VAE escalados a FP8.

Casos de uso

Crear clips de video anime a partir de prompts descriptivos.
Probar HunyuanVideo/Hyvid en ComfyUI con pesos cuantizados de menor tamaño.
Generar escenas anime con personajes, vestuario, fondos detallados y movimiento simple.
Experimentar con flujos GGUF para mejorar velocidad de carga y reducir requisitos de almacenamiento.
Usar prompts de datasets anime como base para pruebas visuales y evaluación de consistencia.