videomae-base-finetuned-ESBD_Augm

OckerGui
Clasificación de video

Este modelo es una versión ajustada de MCG-NJU/videomae-base en un conjunto de datos desconocido. Logra los siguientes resultados en el conjunto de evaluación: Pérdida: 2.4714, Precisión: 0.3810.

Como usar

Se utilizó los siguientes hiperparámetros durante el entrenamiento:

learning_rate: 5e-05
train_batch_size: 12
eval_batch_size: 12
seed: 42
optimizer: Adam con betas=(0.9,0.999) y epsilon=1e-08
lr_scheduler_type: linear
lr_scheduler_warmup_ratio: 0.1
training_steps: 600

Resultados del entrenamiento:

Pérdida de entrenamiento
Época
Paso
Pérdida de validación
Precisión

1.3123
0.09
53
1.6064
0.2619

1.0067
1.09
106
1.0193
0.5952

0.6878
2.09
159
0.7885
0.7143

0.7995
3.09
212
1.2313
0.4524

0.4079
4.09
265
1.1397
0.6667

0.3837
5.09
318
0.7624
0.7857

0.1238
6.09
371
0.7338
0.8571

0.0156
7.09
424
0.8244
0.8333

0.0088
8.09
477
1.0176
0.7619

0.0472
9.09
530
0.8700
0.8333

0.0021
10.09
583
0.9045
0.8095

0.002
11.03
600
0.9068
0.8095

Versiones del framework:

Transformers 4.28.0
Pytorch 2.1.0+cu118
Datasets 2.14.5
Tokenizers 0.13.3

Funcionalidades

Clasificación de Video
Transformers
PyTorch
TensorBoard
Generado a partir de Trainer

Casos de uso

Clasificación de videos en diferentes categorías
Análisis de contenido de video
Identificación de acciones en videos