vivit-b-16x2-kinetics400-finetuned-MSL_40_classes_3
Arekku21
Clasificación de video
Un modelo de clasificación de video finetuneado con 40 clases del conjunto de datos Kinetics400 utilizando la arquitectura ViViT-B-16x2.
Como usar
Este modelo aún no tiene suficiente actividad para ser desplegado en la API de inferencia (sin servidor). Incrementa su visibilidad social y revisa más tarde, o despliega en Endpoints de Inferencia (dedicados).
Para usar el modelo, sigue las instrucciones de la API de inferencia en la plataforma de Hugging Face.
Funcionalidades
- Clasificación de video
- Basado en transformers
- Compatibilidad con TensorBoard
- Formato de modelo en Safetensors
- Tamaño del modelo: 88.7M parámetros
- Tipo de tensor: F32
Casos de uso
- Clasificación de videos en diversas aplicaciones que requieran reconocimiento de acciones en video.