videomae-base-finetuned-lipsync-subset

gautamtata
Clasificación de video

Un modelo de clasificación de video basado en Transformers, ajustado para la clasificación de sincronización labial, con capacidades de visualización en TensorBoard y soporte para Safetensors.

Como usar

Este modelo está diseñado para la clasificación de videos, incluyendo la capacidad de identificar y clasificar la sincronización de labios. Aunque aún no tiene suficiente actividad para ser desplegado en la API de Inferencia (sin servidor), se puede desplegar en los Endpoints de Inferencia dedicados.

Funcionalidades

Clasificación de video
Basado en Transformers
Capacidades de visualización en TensorBoard
Soporte para Safetensors

Casos de uso

Clasificación de videos para sincronización labial
Análisis de videos basados en características específicas