Arekku21/vivit-b-16x2-kinetics400-finetuned-MSL_3
Arekku21
Clasificación de video
Modelo de clasificación de video basado en transformers llamado Vivit. Este modelo está afinado en Kinetics400 y tiene un tamaño de 88.7M parámetros. Utiliza Safetensors y opera con tipos de tensor F32.
Como usar
Este modelo no tiene suficiente actividad para ser implementado en la API de Inferencia aún. Incrementa su visibilidad social y revisa más tarde, o impleméntalo en Endpoints de Inferencia (dedicados) en su lugar.
Funcionalidades
- Clasificación de video
- Basado en transformers
- Utiliza Safetensors
- Tamaño del modelo: 88.7M parámetros
- Tipos de tensor: F32
Casos de uso
- Clasificación de videos en diversas categorías utilizando el modelo de transformers Vivit
- Análisis de contenido de video mediante inferencia