vantagewithai/TurboWan2.1-T2V-14B-720P-ComfyUI-GGUF
vantagewithai
Texto a video
Versión cuantizada en formato GGUF de TurboWan2.1-T2V-14B-720P, preparada para usarse en ComfyUI. Es un modelo de generación de vídeo a partir de texto basado en la arquitectura Wan2.1 T2V de 14B parámetros y en la familia TurboDiffusion, orientada a acelerar modelos de difusión de vídeo.
Como usar
El repositorio indica que este paquete es una versión GGUF de TurboWan2.1-T2V-14B-720P para ComfyUI. No incluye instrucciones detalladas de inferencia ni fragmentos de código de uso en la página proporcionada. Modelo original: https://huggingface.co/TurboDiffusion/TurboWan2.1-T2V-14B-720P
Funcionalidades
- Generación de vídeo desde texto con resolución objetivo 720p.
- Modelo GGUF repaquetado para flujos de trabajo en ComfyUI.
- Basado en Wan-AI/Wan2.1-T2V-14B y cuantizado en múltiples variantes.
- Incluye cuantizaciones de 2 a 8 bits: Q2_K, Q3_K_S, Q3_K_M, Q4_K_S, Q4_0, Q4_1, Q4_K_M, Q5_K_S, Q5_0, Q5_1, Q5_K_M, Q6_K y Q8_0.
- Tamaño del modelo: 14B parámetros; archivos entre 5.3 GB y 15.4 GB según la cuantización.
- Relacionado con TurboDiffusion y técnicas de aceleración como SageAttention y SLA.
Casos de uso
- Crear vídeos cortos a partir de prompts de texto en flujos de trabajo de ComfyUI.
- Experimentar con generación de vídeo Wan2.1 en hardware local usando cuantizaciones GGUF más ligeras.
- Comparar variantes cuantizadas para equilibrar calidad, memoria y velocidad de inferencia.
- Probar técnicas de difusión de vídeo acelerada derivadas de TurboDiffusion.