calcuis/hyvid
calcuis
Texto a video
Versión cuantizada GGUF y versión escalada FP8 de Hyvid/HunyuanVideo para generación de texto a video, preparada para flujos de ComfyUI y orientada a resultados de estilo anime mediante un adaptador LoRA. Está basada en tencent/HunyuanVideo y usa datasets de imágenes anime y descripciones anime.
Como usar
Configuración indicada por la tarjeta del modelo:
Arrastra hyvid_lora_adapter.safetensors [323MB] a ./ComfyUI/models/loras
Arrastra hunyuan-video-t2v-720p-q4_0.gguf [7.74GB] a ./ComfyUI/models/diffusion_models
Arrastra llava_llama3-q4_0.gguf [4.68GB] a ./ComfyUI/models/text_encoders
Arrastra clip_l_fp8_e4m3fn.safetensors [123MB] a ./ComfyUI/models/text_encoders
Arrastra hunyuan_video_vae_fp8_e4m3fn.safetensors [247MB] a ./ComfyUI/models/vae
Para ejecutarlo sin instalación adicional, la página indica usar el archivo .bat del directorio principal si se usa el paquete gguf-node, y después arrastrar el clip de demostración o el archivo JSON del workflow al navegador. La tarjeta enlaza workflows de ejemplo para GGUF y safetensors.
Funcionalidades
- Generación de texto a video con arquitectura Hyvid de 13B parámetros.
- Archivos GGUF cuantizados en varias precisiones, incluyendo Q3, Q4, Q5, Q6 y Q8, para reducir tamaño y acelerar la carga frente a pesos completos.
- Incluye adaptador LoRA anime `hyvid_lora_adapter.safetensors` para mejorar salidas de estilo anime.
- Incluye componentes recomendados para ComfyUI: modelo de difusión HunyuanVideo GGUF, codificador de texto LLaVA-Llama3 GGUF, CLIP FP8 y VAE FP8.
- Soporta flujos de trabajo para GGUF y safetensors, con recomendación de la versión FP8 escalada para safetensors.
- El autor reporta salida más estable cuando el adaptador se aplica correctamente, incluso con CLIP y VAE escalados a FP8.
Casos de uso
- Crear clips de video anime a partir de prompts descriptivos.
- Probar HunyuanVideo/Hyvid en ComfyUI con pesos cuantizados de menor tamaño.
- Generar escenas anime con personajes, vestuario, fondos detallados y movimiento simple.
- Experimentar con flujos GGUF para mejorar velocidad de carga y reducir requisitos de almacenamiento.
- Usar prompts de datasets anime como base para pruebas visuales y evaluación de consistencia.