Arekku21/vivit-b-16x2-kinetics400-finetuned-MSL_3

Arekku21

Clasificación de video

Modelo de clasificación de video basado en transformers llamado Vivit. Este modelo está afinado en Kinetics400 y tiene un tamaño de 88.7M parámetros. Utiliza Safetensors y opera con tipos de tensor F32.

Como usar

Este modelo no tiene suficiente actividad para ser implementado en la API de Inferencia aún. Incrementa su visibilidad social y revisa más tarde, o impleméntalo en Endpoints de Inferencia (dedicados) en su lugar.

Funcionalidades

Clasificación de video
Basado en transformers
Utiliza Safetensors
Tamaño del modelo: 88.7M parámetros
Tipos de tensor: F32

Casos de uso

Clasificación de videos en diversas categorías utilizando el modelo de transformers Vivit
Análisis de contenido de video mediante inferencia