vivit-b-16x2-kinetics400-UCF-Crime

prathameshdalal
Clasificación de video

Este modelo es una versión ajustada de google/vivit-b-16x2-kinetics400 en el conjunto de datos UCF-Crime. Logra los siguientes resultados en el conjunto de evaluación: Pérdida: 1.9757, Precisión: 0.6149.

Como usar

Necesita más información.

Hyperparámetros de entrenamiento:

{
  "learning_rate": 5e-05,
  "train_batch_size": 8,
  "eval_batch_size": 8,
  "seed": 42,
  "optimizer": "Adam con betas=(0.9,0.999) y epsilon=1e-08",
  "lr_scheduler_type": "lineal",
  "lr_scheduler_warmup_ratio": 0.1,
  "training_steps": 3132
}

Resultados de entrenamiento:

[
  { "Epoch": 1,  "Step": 196,  "Validation Loss": 1.6400, "Accuracy": 0.5518 },
  { "Epoch": 2,  "Step": 392,  "Validation Loss": 1.4988, "Accuracy": 0.5634 },
  { "Epoch": 3,  "Step": 588,  "Validation Loss": 1.5328, "Accuracy": 0.5861 },
  { "Epoch": 4,  "Step": 784,  "Validation Loss": 1.3932, "Accuracy": 0.6178 },
  { "Epoch": 5,  "Step": 980,  "Validation Loss": 1.5449, "Accuracy": 0.6060 },
  { "Epoch": 6,  "Step": 1176, "Validation Loss": 1.3075, "Accuracy": 0.6287 },
  { "Epoch": 7,  "Step": 1372, "Validation Loss": 1.6743, "Accuracy": 0.6001 },
  { "Epoch": 8,  "Step": 1568, "Validation Loss": 1.5287, "Accuracy": 0.6172 },
  { "Epoch": 9,  "Step": 1764, "Validation Loss": 1.7749, "Accuracy": 0.6089 },
  { "Epoch": 10, "Step": 1960, "Validation Loss": 1.9027, "Accuracy": 0.6076 },
  { "Epoch": 11, "Step": 2156, "Validation Loss": 1.9622, "Accuracy": 0.6085 },
  { "Epoch": 12, "Step": 2352, "Validation Loss": 2.0872, "Accuracy": 0.6152 },
  { "Epoch": 13, "Step": 2548, "Validation Loss": 2.0095, "Accuracy": 0.6094 },
  { "Epoch": 14, "Step": 2744, "Validation Loss": 1.9398, "Accuracy": 0.6232 },
  { "Epoch": 15, "Step": 2940, "Validation Loss": 1.9994, "Accuracy": 0.6134 },
  { "Epoch": 16, "Step": 3132, "Validation Loss": 1.9757, "Accuracy": 0.6149 }
]

Versiones de los frameworks:

  • Transformers 4.33.2
  • Pytorch 1.10.0+cu113
  • Datasets 2.14.5
  • Tokenizers 0.13.3

Funcionalidades

Clasificación de videos
Transformers
PyTorch
Generado desde Trainer
Soporta Endpoints de Inferencia

Casos de uso

Clasificación de actividades en videos
Análisis de seguridad en videos usando el conjunto de datos UCF-Crime
Investigación y desarrollo en visión por computadora