videomae-small-finetuned-kinetics-finetuned-ucf101-subset

ninhnguyendx779
Clasificación de video

Este modelo es una versión ajustada de MCG-NJU/videomae-small-finetuned-kinetics en un conjunto de datos desconocido. Logra los siguientes resultados en el conjunto de evaluación: Pérdida: 0.4149, Precisión: 0.9355. El modelo se ha entrenado utilizando una variedad de hiperparámetros especificados, y se han utilizado diferentes versiones de marcos como Transformers 4.39.3, Pytorch 2.2.1+cu121, Datasets 2.18.0 y Tokenizers 0.15.2.

Como usar

Hiperparámetros de entrenamiento

{
  "learning_rate": "5e-05",
  "train_batch_size": "2",
  "eval_batch_size": "2",
  "seed": "42",
  "optimizer": "Adam con betas=(0.9,0.999) y epsilon=1e-08",
  "lr_scheduler_type": "lineal",
  "lr_scheduler_warmup_ratio": "0.1",
  "training_steps": "600"
}

Resultados de entrenamiento

Pérdida de entrenamiento | Época | Paso | Pérdida de validación | Precisión
---|---|---|---|---
1.0253 | 0.25 | 150 | 0.9132 | 0.9
0.4108 | 1.25 | 300 | 0.3571 | 0.9857
0.1051 | 2.25 | 450 | 0.3968 | 0.8714
0.1796 | 3.25 | 600 | 0.1280 | 0.9857

Funcionalidades

Clasificación de video
Transformers
Compatibilidad con TensorBoard
Safetensors
Pérdida: 0.4149
Precisión: 0.9355

Casos de uso

Clasificación de actividades en videos
Análisis de contenidos en videos
Desarrollo de soluciones en tiempo real para la identificación de acciones categorizadas