timesformer-base-finetuned-k400-finetuned-ucf101-subset

giannisan

Clasificación de video

Este modelo es una versión ajustada de facebook/timesformer-base-finetuned-k400 en un conjunto de datos desconocido. Logra los siguientes resultados en el conjunto de evaluación: Pérdida: 0.0878, Precisión: 1.0

Como usar

Procedimiento de entrenamiento
Los siguientes hiperparámetros se utilizaron durante el entrenamiento:

learning_rate: 5e-05
train_batch_size: 6
eval_batch_size: 6
seed: 42
optimizer: Adam con betas=(0.9,0.999) y epsilon=1e-08
lr_scheduler_type: linear
lr_scheduler_warmup_ratio: 0.1
training_steps: 200

Resultados del entrenamiento
| Pérdida de entrenamiento | Época | Paso | Pérdida de validación | Precisión |
| ------------------------ | ----- | ---- | --------------------- | -------- |
| 0.1523                   | 0.25  | 50   | 0.0735                | 1.0      |
| 0.024                    | 1.25  | 100  | 0.0470                | 0.9866   |
| 0.0583                   | 2.25  | 150  | 0.0302                | 0.9866   |
| 0.0036                   | 3.25  | 200  | 0.0297                | 0.9866   |
Frameworks utilizados

Transformers 4.40.2
Pytorch 2.1.0+cu118
Datasets 2.19.1
Tokenizers 0.19.1

Funcionalidades

Clasificación de video
Transformers
Tamaño del modelo: 121M parámetros
Tipo de tensor: F32

Casos de uso

Clasificación de videos en diversas categorías.
Análisis de contenido de videos.