videomae-base-short-finetuned-ssv2-finetuned-rwf2000-epochs8-batch8-fp16
lmazzon70
Clasificación de video
Este modelo es una versión afinada de MCG-NJU/videomae-base-short-finetuned-ssv2 en un conjunto de datos desconocido. Logró los siguientes resultados en el conjunto de evaluación: Pérdida: 1.4339 Precisión: 0.4643
Como usar
Más información necesaria
Hyperparámetros utilizados durante el entrenamiento:
- learning_rate: 5e-05
- train_batch_size: 2
- eval_batch_size: 2
- seed: 42
- gradient_accumulation_steps: 4
- total_train_batch_size: 8
- optimizer: Adam con betas=(0.9,0.999) y epsilon=1e-08
- lr_scheduler_type: linear
- lr_scheduler_warmup_ratio: 0.1
- training_steps: 3200
- mixed_precision_training: AMP nativo
Resultados del entrenamiento
- Pérdida de Entrenamiento
- Época
- Paso
- Pérdida de Validación
- Precisión
0.4239 0.06 200 0.3879 0.82
0.4179 1.06 400 1.1635 0.6162
0.4329 2.06 600 0.8215 0.63
0.3051 3.06 800 0.5541 0.7412
0.172 4.06 1000 0.4696 0.8363
0.1955 5.06 1200 0.5384 0.78
0.2301 6.06 1400 1.3358 0.635
0.2995 7.06 1600 1.0372 0.7087
0.3789 8.06 1800 0.8670 0.7412
0.2525 9.06 2000 0.5886 0.8225
0.1846 10.06 2200 0.7851 0.735
0.1547 11.06 2400 0.8905 0.7638
0.2501 12.06 2600 0.9807 0.76
0.1046 13.06 2800 1.0419 0.7438
0.0786 14.06 3000 1.0128 0.7538
0.0178 15.06 3200 1.0156 0.75
Funcionalidades
- Clasificación de videos
- Transformers
- PyTorch
- TensorBoard
- Generado a partir de Trainer
- Puntos finales de inferencia
Casos de uso
- Clasificación de videos
- Aplicaciones de visión por computadora
- Análisis de contenido multimedia