videomae-base-finetuned-RealLifeViolenceSituations-subset

dangle124
Clasificación de video

Este modelo es una versión afinada de MCG-NJU/videomae-base en un conjunto de datos desconocido. Logra los siguientes resultados en el conjunto de evaluación: Pérdida: 0.1618, Precisión: 0.9533.

Como usar

Procedimiento de Entrenamiento

Los siguientes hiperparámetros se utilizaron durante el entrenamiento:

  • learning_rate: 5e-05
  • train_batch_size: 8
  • eval_batch_size: 8
  • seed: 42
  • optimizer: Adam con betas=(0.9,0.999) y epsilon=1e-08
  • lr_scheduler_type: linear
  • lr_scheduler_warmup_ratio: 0.1
  • training_steps: 800

Resultados de Entrenamiento

|Pérdida Entrenamiento|Época|Paso|Precisión|Pérdida de Validación| |---|---|---|---|---| |0.1065|0.25|200|0.9598|0.1470| |0.067|1.25|400|0.9625|0.1415| |0.0058|2.25|600|0.9625|0.1415| |0.0274|3.25|800|0.9625|0.1415| |0.0274|1.0|801|0.1411|0.9626|

Versiones del Framework

  • Transformers 4.27.2
  • Pytorch 1.13.1
  • Datasets 2.10.1
  • Tokenizers 0.13.2

Funcionalidades

Clasificación de Video
Transformers
PyTorch
videomae
Generado a partir de Trainer

Casos de uso

Clasificación de situaciones de violencia en videos de la vida real