videomae-base-finetuned-ucf101-subset

burcusu
Clasificación de video

Este modelo es una versión optimizada de MCG-NJU/videomae-base en un conjunto de datos desconocido. Logra los siguientes resultados en el conjunto de evaluación: Pérdida: 0.1527, Precisión: 0.9522.

Como usar

Procedimiento de entrenamiento

Los siguientes hiperparámetros se utilizaron durante el entrenamiento:

learning_rate: 5e-05
train_batch_size: 2
eval_batch_size: 2
seed: 42
optimizador: Adam con betas=(0.9, 0.999) y epsilon=1e-08
lr_scheduler_type: lineal
lr_scheduler_warmup_ratio: 0.1
training_steps: 932

Resultados del entrenamiento

| Pérdida de Entrenamiento | Época | Paso | Pérdida de Validación | Precisión | |---------------------------|-------|------|-----------------------|-----------| | 1.0091 | 0.25 | 233 | 1.0615 | 0.6618 | | 0.365 | 1.25 | 466 | 0.5371 | 0.8051 | | 0.1671 | 2.25 | 699 | 0.3670 | 0.8897 | | 0.0051 | 3.25 | 932 | 0.1527 | 0.9522 |

Versiones del marco de trabajo

  • Transformers 4.25.1
  • Pytorch 1.13.0+cu116
  • Datasets 2.8.0
  • Tokenizers 0.13.2

Funcionalidades

Clasificación de video
Transformers
PyTorch
TensorBoard
Generado a partir de Trainer
Puntos finales de inferencia
Licencia: cc-by-nc-4.0

Casos de uso

Clasificación de acciones y actividades en videos
Análisis automatizado de contenido de video
Integración en sistemas de vigilancia para la identificación de comportamientos