Arekku21/vivit-b-16x2-kinetics400-finetuned-MSL_40_classes_7
Arekku21
Clasificación de video
Modelo de clasificación de videos basado en Transformers, utilizando vivit. Finetuned con el dataset Kinetics400 y MSL con 40 clases. Posee 88.7M parámetros y tipo de tensor F32.
Como usar
Este modelo aún no tiene suficiente actividad para ser desplegado en la API de Inferencia (sin servidor). Aumente su visibilidad social y vuelva a comprobar más tarde, o implemente en Endpoints de Inferencia (dedicada).
Funcionalidades
- Clasificación de videos
- Basado en Transformers
- Finetune con Kinetics400
- 40 clases
- 88.7M parámetros
- Tipo de tensor F32
- Compatibilidad con TensorBoard
- Formato Safetensors
Casos de uso
- Clasificación de actividades en videos
- Aplicaciones de reconocimiento de acciones
- Análisis de contenidos multimedia