videomae-base-finetuned-ucf101-subset

burcusu

Clasificación de video

Este modelo es una versión optimizada de MCG-NJU/videomae-base en un conjunto de datos desconocido. Logra los siguientes resultados en el conjunto de evaluación: Pérdida: 0.1527, Precisión: 0.9522.

Como usar

Procedimiento de entrenamiento
Los siguientes hiperparámetros se utilizaron durante el entrenamiento:
learning_rate: 5e-05
train_batch_size: 2
eval_batch_size: 2
seed: 42
optimizador: Adam con betas=(0.9, 0.999) y epsilon=1e-08
lr_scheduler_type: lineal
lr_scheduler_warmup_ratio: 0.1
training_steps: 932

Resultados del entrenamiento
| Pérdida de Entrenamiento | Época | Paso | Pérdida de Validación | Precisión |
|---------------------------|-------|------|-----------------------|-----------|
| 1.0091                    | 0.25  | 233  | 1.0615                | 0.6618    |
| 0.365                     | 1.25  | 466  | 0.5371                | 0.8051    |
| 0.1671                    | 2.25  | 699  | 0.3670                | 0.8897    |
| 0.0051                    | 3.25  | 932  | 0.1527                | 0.9522    |
Versiones del marco de trabajo

Transformers 4.25.1
Pytorch 1.13.0+cu116
Datasets 2.8.0
Tokenizers 0.13.2

Funcionalidades

Clasificación de video
Transformers
PyTorch
TensorBoard
Generado a partir de Trainer
Puntos finales de inferencia
Licencia: cc-by-nc-4.0

Casos de uso

Clasificación de acciones y actividades en videos
Análisis automatizado de contenido de video
Integración en sistemas de vigilancia para la identificación de comportamientos