vivit-b-16x2-kinetics400-finetuned-0505-mediapipe
kkumtori
Clasificación de video
Este modelo es una versión ajustada de google/vivit-b-16x2-kinetics400 en un dataset desconocido. Estaba entrenado para la clasificación de videos y se logra los siguientes resultados en el conjunto de evaluación: Pérdida: 1.3416, Precisión: 0.54.
Como usar
La API Inference para la clasificación de videos no está disponible. Necesita aumentar su visibilidad social o desplegar en Inference Endpoints en su lugar.
Funcionalidades
- Clasificación de videos
- Optimizado con Adam con betas=(0.9, 0.999) y epsilon=1e-08
- Tasa de aprendizaje: 5e-05
- Tamaño del lote de entrenamiento: 2
- Tamaño del lote de evaluación: 2
- Semilla: 42
- Programador LR de tipo lineal
- Proporción de calentamiento del programador LR: 0.1
- Pasos de entrenamiento: 520
Casos de uso
- Clasificación de secuencias de video
- Investigación en visión por computadora