vantagewithai/TurboWan2.1-T2V-14B-720P-ComfyUI-GGUF

vantagewithai

Texto a video

Versión cuantizada en formato GGUF de TurboWan2.1-T2V-14B-720P, preparada para usarse en ComfyUI. Es un modelo de generación de vídeo a partir de texto basado en la arquitectura Wan2.1 T2V de 14B parámetros y en la familia TurboDiffusion, orientada a acelerar modelos de difusión de vídeo.

Como usar

El repositorio indica que este paquete es una versión GGUF de TurboWan2.1-T2V-14B-720P para ComfyUI. No incluye instrucciones detalladas de inferencia ni fragmentos de código de uso en la página proporcionada. Modelo original: https://huggingface.co/TurboDiffusion/TurboWan2.1-T2V-14B-720P

Funcionalidades

Generación de vídeo desde texto con resolución objetivo 720p.
Modelo GGUF repaquetado para flujos de trabajo en ComfyUI.
Basado en Wan-AI/Wan2.1-T2V-14B y cuantizado en múltiples variantes.
Incluye cuantizaciones de 2 a 8 bits: Q2_K, Q3_K_S, Q3_K_M, Q4_K_S, Q4_0, Q4_1, Q4_K_M, Q5_K_S, Q5_0, Q5_1, Q5_K_M, Q6_K y Q8_0.
Tamaño del modelo: 14B parámetros; archivos entre 5.3 GB y 15.4 GB según la cuantización.
Relacionado con TurboDiffusion y técnicas de aceleración como SageAttention y SLA.

Casos de uso

Crear vídeos cortos a partir de prompts de texto en flujos de trabajo de ComfyUI.
Experimentar con generación de vídeo Wan2.1 en hardware local usando cuantizaciones GGUF más ligeras.
Comparar variantes cuantizadas para equilibrar calidad, memoria y velocidad de inferencia.
Probar técnicas de difusión de vídeo acelerada derivadas de TurboDiffusion.