Arekku21/vivit-b-16x2-kinetics400-finetuned-MSL_40_classes_7

Arekku21

Clasificación de video

Modelo de clasificación de videos basado en Transformers, utilizando vivit. Finetuned con el dataset Kinetics400 y MSL con 40 clases. Posee 88.7M parámetros y tipo de tensor F32.

Como usar

Este modelo aún no tiene suficiente actividad para ser desplegado en la API de Inferencia (sin servidor). Aumente su visibilidad social y vuelva a comprobar más tarde, o implemente en Endpoints de Inferencia (dedicada).

Funcionalidades

Clasificación de videos
Basado en Transformers
Finetune con Kinetics400
40 clases
88.7M parámetros
Tipo de tensor F32
Compatibilidad con TensorBoard
Formato Safetensors

Casos de uso

Clasificación de actividades en videos
Aplicaciones de reconocimiento de acciones
Análisis de contenidos multimedia