videomae-base-short-finetuned-ssv2-finetuned-rwf2000-epochs8-batch8-fp16

lmazzon70

Clasificación de video

Este modelo es una versión afinada de MCG-NJU/videomae-base-short-finetuned-ssv2 en un conjunto de datos desconocido. Logró los siguientes resultados en el conjunto de evaluación: Pérdida: 1.4339 Precisión: 0.4643

Como usar

Más información necesaria
Hyperparámetros utilizados durante el entrenamiento:

learning_rate: 5e-05
train_batch_size: 2
eval_batch_size: 2
seed: 42
gradient_accumulation_steps: 4
total_train_batch_size: 8
optimizer: Adam con betas=(0.9,0.999) y epsilon=1e-08
lr_scheduler_type: linear
lr_scheduler_warmup_ratio: 0.1
training_steps: 3200
mixed_precision_training: AMP nativo


Resultados del entrenamiento

 - Pérdida de Entrenamiento
 - Época
 - Paso
 - Pérdida de Validación
 - Precisión

 0.4239  0.06 200  0.3879  0.82

 0.4179 1.06 400 1.1635 0.6162

 0.4329 2.06 600 0.8215 0.63

 0.3051 3.06 800 0.5541 0.7412

 0.172 4.06 1000 0.4696 0.8363

 0.1955 5.06 1200 0.5384 0.78

 0.2301 6.06 1400 1.3358 0.635

 0.2995 7.06 1600 1.0372 0.7087

 0.3789 8.06 1800 0.8670 0.7412

 0.2525 9.06 2000 0.5886 0.8225

 0.1846 10.06 2200 0.7851 0.735

 0.1547 11.06 2400 0.8905 0.7638

 0.2501 12.06 2600 0.9807 0.76

 0.1046 13.06 2800 1.0419 0.7438

 0.0786 14.06 3000 1.0128 0.7538

 0.0178 15.06 3200 1.0156 0.75

Funcionalidades

Clasificación de videos
Transformers
PyTorch
TensorBoard
Generado a partir de Trainer
Puntos finales de inferencia

Casos de uso

Clasificación de videos
Aplicaciones de visión por computadora
Análisis de contenido multimedia