Arekku21/vivit-b-16x2-kinetics400-finetuned-MSL_40_classes_4

Arekku21
Clasificación de video

El modelo Arekku21/vivit-b-16x2-kinetics400-finetuned-MSL_40_classes_4 es un modelo de clasificación de video que utiliza transformers y se puede visualizar con TensorBoard. Forma parte de la familia de modelos VivIT y ha sido afinado utilizando el dataset Kinetics400 para clasificar 40 clases. El tamaño del modelo es de 88.7 millones de parámetros con tipo de tensor F32.

Como usar

El modelo actualmente no tiene suficiente actividad para ser desplegado en la API de Inferencia de Hugging Face (sin servidor). Sin embargo, se puede desplegar en Endpoints de Inferencia dedicados.

Funcionalidades

Clasificación de video
Transformers
Compatibilidad con TensorBoard
Modelo Safetensors
88.7M parámetros
Tipo de tensor F32

Casos de uso

Clasificación de videos en 40 clases diferentes
Implementación en aplicaciones que requieren análisis de contenido de video
Uso educativo y de investigación en el campo de la visión por computadora