Arekku21/vivit-b-16x2-kinetics400-finetuned-MSL_40_classes_4
Arekku21
Clasificación de video
El modelo Arekku21/vivit-b-16x2-kinetics400-finetuned-MSL_40_classes_4 es un modelo de clasificación de video que utiliza transformers y se puede visualizar con TensorBoard. Forma parte de la familia de modelos VivIT y ha sido afinado utilizando el dataset Kinetics400 para clasificar 40 clases. El tamaño del modelo es de 88.7 millones de parámetros con tipo de tensor F32.
Como usar
El modelo actualmente no tiene suficiente actividad para ser desplegado en la API de Inferencia de Hugging Face (sin servidor). Sin embargo, se puede desplegar en Endpoints de Inferencia dedicados.
Funcionalidades
- Clasificación de video
- Transformers
- Compatibilidad con TensorBoard
- Modelo Safetensors
- 88.7M parámetros
- Tipo de tensor F32
Casos de uso
- Clasificación de videos en 40 clases diferentes
- Implementación en aplicaciones que requieren análisis de contenido de video
- Uso educativo y de investigación en el campo de la visión por computadora