vivit-b-16x2-kinetics400-finetuned-0505-mediapipe

kkumtori
Clasificación de video

Este modelo es una versión ajustada de google/vivit-b-16x2-kinetics400 en un dataset desconocido. Estaba entrenado para la clasificación de videos y se logra los siguientes resultados en el conjunto de evaluación: Pérdida: 1.3416, Precisión: 0.54.

Como usar

La API Inference para la clasificación de videos no está disponible. Necesita aumentar su visibilidad social o desplegar en Inference Endpoints en su lugar.

Funcionalidades

Clasificación de videos
Optimizado con Adam con betas=(0.9, 0.999) y epsilon=1e-08
Tasa de aprendizaje: 5e-05
Tamaño del lote de entrenamiento: 2
Tamaño del lote de evaluación: 2
Semilla: 42
Programador LR de tipo lineal
Proporción de calentamiento del programador LR: 0.1
Pasos de entrenamiento: 520

Casos de uso

Clasificación de secuencias de video
Investigación en visión por computadora