vivit-b-16x2-kinetics400-finetuned-MSL_40_classes_3

Arekku21

Clasificación de video

Un modelo de clasificación de video finetuneado con 40 clases del conjunto de datos Kinetics400 utilizando la arquitectura ViViT-B-16x2.

Como usar

Este modelo aún no tiene suficiente actividad para ser desplegado en la API de inferencia (sin servidor). Incrementa su visibilidad social y revisa más tarde, o despliega en Endpoints de Inferencia (dedicados).
Para usar el modelo, sigue las instrucciones de la API de inferencia en la plataforma de Hugging Face.

Funcionalidades

Clasificación de video
Basado en transformers
Compatibilidad con TensorBoard
Formato de modelo en Safetensors
Tamaño del modelo: 88.7M parámetros
Tipo de tensor: F32

Casos de uso

Clasificación de videos en diversas aplicaciones que requieran reconocimiento de acciones en video.