videomae-base-finetuned-RealLifeViolenceSituations-subset

dangle124

Clasificación de video

Este modelo es una versión afinada de MCG-NJU/videomae-base en un conjunto de datos desconocido. Logra los siguientes resultados en el conjunto de evaluación: Pérdida: 0.1618, Precisión: 0.9533.

Como usar

Procedimiento de Entrenamiento
Los siguientes hiperparámetros se utilizaron durante el entrenamiento:

learning_rate: 5e-05
train_batch_size: 8
eval_batch_size: 8
seed: 42
optimizer: Adam con betas=(0.9,0.999) y epsilon=1e-08
lr_scheduler_type: linear
lr_scheduler_warmup_ratio: 0.1
training_steps: 800

Resultados de Entrenamiento
|Pérdida Entrenamiento|Época|Paso|Precisión|Pérdida de Validación|
|---|---|---|---|---|
|0.1065|0.25|200|0.9598|0.1470|
|0.067|1.25|400|0.9625|0.1415|
|0.0058|2.25|600|0.9625|0.1415|
|0.0274|3.25|800|0.9625|0.1415|
|0.0274|1.0|801|0.1411|0.9626|
Versiones del Framework

Transformers 4.27.2
Pytorch 1.13.1
Datasets 2.10.1
Tokenizers 0.13.2

Funcionalidades

Clasificación de Video
Transformers
PyTorch
videomae
Generado a partir de Trainer

Casos de uso

Clasificación de situaciones de violencia en videos de la vida real