timesformer-base-finetuned-k400-finetuned-crema-d

minhah
Clasificación de video

Este modelo es una versión afinada de facebook/timesformer-base-finetuned-k400 en un conjunto de datos desconocido. Logra los siguientes resultados en el conjunto de evaluación: Pérdida (Loss): 0.9485 Precisión (Accuracy): 0.6120

Como usar

El modelo usa los siguientes hiperparámetros durante el entrenamiento:

learning_rate: 5e-05
train_batch_size: 8
eval_batch_size: 8
seed: 42
optimizer: Adam con betas=(0.9,0.999) y epsilon=1e-08
lr_scheduler_type: linear
lr_scheduler_warmup_ratio: 0.1
training_steps: 2976

Los resultados del entrenamiento son los siguientes:

Pérdida de Entrenamiento: 1.0116
Epoch: 0.25
Paso: 745
Pérdida de Validación: 1.2479
Precisión: 0.5131

Pérdida de Entrenamiento: 0.9527
Epoch: 1.25
Paso: 1490
Pérdida de Validación: 1.2328
Precisión: 0.5498

Pérdida de Entrenamiento: 0.5409
Epoch: 2.25
Paso: 2235
Pérdida de Validación: 0.9364
Precisión: 0.6515

Pérdida de Entrenamiento: 0.5551
Epoch: 3.25
Paso: 2976
Pérdida de Validación: 0.9392
Precisión: 0.6438

Verifica la tabla de versiones del framework:

Transformers: 4.38.2
Pytorch: 2.1.0+cu121
Datasets: 2.18.0
Tokenizers: 0.15.2

Funcionalidades

Clasificación de video
Transformers
Safetensors

Casos de uso

Clasificación de videos