vivit-b-16x2-kinetics400-finetuned-vivit-diagnose
Este modelo es una versión afinada del google/vivit-b-16x2-kinetics400 en un conjunto de datos desconocido. Logra los siguientes resultados en el conjunto de evaluación: Pérdida: 1.8988, Precisión: 0.6953. Utiliza el optimizador Adam con betas=0.9,0.999 y epsilon=1e-08. También emplea un programador de tasa de aprendizaje de tipo lineal con una proporción de calentamiento del 0.1. El modelo se entrenó durante 3430 pasos. Se basa en las versiones de marcos Transformers 4.42.4, Pytorch 2.0.1+cu117, Datasets 2.20.0, y Tokenizers 0.19.1.
Como usar
Aquí se describen los hiperparámetros utilizados durante el entrenamiento:
- Tasa de aprendizaje: 5e-05
- Tamaño del lote de entrenamiento: 1
- Tamaño del lote de evaluación: 1
- Semilla: 42
- Optimizador: Adam con betas=(0.9,0.999) y epsilon=1e-08
- Tipo de programador de tasa de aprendizaje: lineal
- Proporción de calentamiento del programador: 0.1
- Pasos de entrenamiento: 3430
Resultados del Entrenamiento
-
Pérdida de entrenamiento: 1.8386
-
Época: 0.1
-
Paso: 343
-
Pérdida de validación: 1.5448
-
Precisión: 0.5448
-
Pérdida de entrenamiento: 1.1419
-
Época: 1.1
-
Paso: 686
-
Pérdida de validación: 1.2918
-
Precisión: 0.5412
-
Pérdida de entrenamiento: 0.778
-
Época: 2.1
-
Paso: 1029
-
Pérdida de validación: 1.4229
-
Precisión: 0.7240
-
Pérdida de entrenamiento: 0.7591
-
Época: 3.1
-
Paso: 1372
-
Pérdida de validación: 1.5418
-
Precisión: 0.6918
-
Pérdida de entrenamiento: 0.8103
-
Época: 4.1
-
Paso: 1715
-
Pérdida de validación: 1.3608
-
Precisión: 0.6810
-
Pérdida de entrenamiento: 0.3701
-
Época: 5.1
-
Paso: 2058
-
Pérdida de validación: 1.6575
-
Precisión: 0.6810
-
Pérdida de entrenamiento: 0.2027
-
Época: 6.1
-
Paso: 2401
-
Pérdida de validación: 1.8233
-
Precisión: 0.6774
-
Pérdida de entrenamiento: 0.0002
-
Época: 7.1
-
Paso: 2744
-
Pérdida de validación: 1.9324
-
Precisión: 0.6738
-
Pérdida de entrenamiento: 0.1793
-
Época: 8.1
-
Paso: 3087
-
Pérdida de validación: 1.8483
-
Precisión: 0.6953
-
Pérdida de entrenamiento: 0.0007
-
Época: 9.1
-
Paso: 3430
-
Pérdida de validación: 1.8988
-
Precisión: 0.6953
Funcionalidades
- Clasificación de Video
- Transformers
- TensorBoard
- Safetensors
Casos de uso
- Clasificación de videos
- Análisis de desempeño en videos
- Identificación de patrones en grabaciones de video