videomae-base-finetuned-lipsync-subset
gautamtata
Clasificación de video
Un modelo de clasificación de video basado en Transformers, ajustado para la clasificación de sincronización labial, con capacidades de visualización en TensorBoard y soporte para Safetensors.
Como usar
Este modelo está diseñado para la clasificación de videos, incluyendo la capacidad de identificar y clasificar la sincronización de labios. Aunque aún no tiene suficiente actividad para ser desplegado en la API de Inferencia (sin servidor), se puede desplegar en los Endpoints de Inferencia dedicados.
Funcionalidades
- Clasificación de video
- Basado en Transformers
- Capacidades de visualización en TensorBoard
- Soporte para Safetensors
Casos de uso
- Clasificación de videos para sincronización labial
- Análisis de videos basados en características específicas