timesformer-base-finetuned-k400-finetuned-ucf101-subset

giannisan
Clasificación de video

Este modelo es una versión ajustada de facebook/timesformer-base-finetuned-k400 en un conjunto de datos desconocido. Logra los siguientes resultados en el conjunto de evaluación: Pérdida: 0.0878, Precisión: 1.0

Como usar

Procedimiento de entrenamiento

Los siguientes hiperparámetros se utilizaron durante el entrenamiento:

  • learning_rate: 5e-05
  • train_batch_size: 6
  • eval_batch_size: 6
  • seed: 42
  • optimizer: Adam con betas=(0.9,0.999) y epsilon=1e-08
  • lr_scheduler_type: linear
  • lr_scheduler_warmup_ratio: 0.1
  • training_steps: 200

Resultados del entrenamiento

| Pérdida de entrenamiento | Época | Paso | Pérdida de validación | Precisión | | ------------------------ | ----- | ---- | --------------------- | -------- | | 0.1523 | 0.25 | 50 | 0.0735 | 1.0 | | 0.024 | 1.25 | 100 | 0.0470 | 0.9866 | | 0.0583 | 2.25 | 150 | 0.0302 | 0.9866 | | 0.0036 | 3.25 | 200 | 0.0297 | 0.9866 |

Frameworks utilizados

  • Transformers 4.40.2
  • Pytorch 2.1.0+cu118
  • Datasets 2.19.1
  • Tokenizers 0.19.1

Funcionalidades

Clasificación de video
Transformers
Tamaño del modelo: 121M parámetros
Tipo de tensor: F32

Casos de uso

Clasificación de videos en diversas categorías.
Análisis de contenido de videos.