QuantStack/Wan2.2-Fun-A14B-Control-GGUF
QuantStack
Texto a video
Conversión directa a GGUF cuantizada de alibaba-pai/Wan2.2-Fun-A14B-Control, un modelo Wan2.2 de 14B parámetros para generación de texto a vídeo con control, pensado para usarse localmente en ComfyUI mediante el nodo personalizado ComfyUI-GGUF. Mantiene los términos de licencia y restricciones de uso del modelo original.
Como usar
El modelo se usa con ComfyUI y el nodo personalizado ComfyUI-GGUF de city96. Los archivos del modelo principal deben colocarse en ComfyUI/models/unet; el codificador de texto Umt5-xxl en ComfyUI/models/text_encoders; y el VAE Wan2.1 en ComfyUI/models/vae. La página no incluye snippets de código, solo instrucciones de instalación y ubicación de archivos.
Funcionalidades
- Generación de texto a vídeo con arquitectura Wan.
- Modelo cuantizado en formato GGUF para ejecución local más eficiente.
- Disponible en múltiples cuantizaciones de 2 a 8 bits, desde Q2_K de 5.31 GB hasta Q8_0 de 15.4 GB.
- Compatibilidad prevista con ComfyUI mediante el nodo ComfyUI-GGUF de city96.
- Incluye indicaciones de ubicación para componentes necesarios: modelo principal en `ComfyUI/models/unet`, codificador Umt5-xxl en `ComfyUI/models/text_encoders` y VAE Wan2.1 en `ComfyUI/models/vae`.
- Basado en Wan-AI/Wan2.2-I2V-A14B y cuantizado a partir del ajuste alibaba-pai/Wan2.2-Fun-A14B-Control.
Casos de uso
- Generación local de vídeos a partir de texto en flujos de trabajo de ComfyUI.
- Experimentación con Wan2.2-Fun-A14B-Control usando cuantizaciones GGUF para ajustar consumo de memoria y calidad.
- Producción creativa de vídeo asistida por IA donde se necesita un modelo de texto a vídeo controlable.
- Pruebas comparativas entre variantes GGUF de 2, 3, 4, 5, 6 y 8 bits.