videomae-base-finetuned-ElderReact-Surprise11

minhah
Clasificación de video

Este modelo es una versión afinada de MCG-NJU/videomae-base en un conjunto de datos desconocido. El modelo logra los siguientes resultados en el conjunto de evaluación: Pérdida: 0.6381 Precisión: 0.652

Como usar

Se usaron los siguientes hiperparámetros durante el entrenamiento:

  • learning_rate: 5e-05
  • train_batch_size: 16
  • eval_batch_size: 16
  • seed: 42
  • optimizer: Adam con betas=(0.9,0.999) y epsilon=1e-08
  • lr_scheduler_type: lineal
  • lr_scheduler_warmup_ratio: 0.1
  • training_steps: 380

Resultados del entrenamiento:

| Pérdida de Entrenamiento | Época | Paso | Pérdida de Validación | Precisión | |--------------------------|-------|------|-----------------------|-----------| | 0.7047 | 0.1 | 39 | 0.6542 | 0.5892 | | 0.7111 | 1.1 | 78 | 0.6551 | 0.5854 | | 0.6839 | 2.1 | 117 | 0.6406 | 0.6508 | | 0.6872 | 3.1 | 156 | 0.6314 | 0.6307 | | 0.6678 | 4.1 | 195 | 0.6236 | 0.6671 | | 0.5806 | 5.1 | 234 | 0.6078 | 0.6482 | | 0.5697 | 6.1 | 273 | 0.6825 | 0.5980 | | 0.6127 | 7.1 | 312 | 0.6446 | 0.6005 | | 0.5645 | 8.1 | 351 | 0.6240 | 0.6307 | | 0.549 | 9.08 | 380 | 0.6290 | 0.6181 |

La versión de las bibliotecas utilizadas son:

  • Transformers: 4.38.2
  • Pytorch: 2.1.0+cu121
  • Datasets: 2.18.0
  • Tokenizers: 0.15.2

Funcionalidades

Clasificación de videos
Uso de transformers
Pesos en formato Safetensors
Generado utilizando Trainer de Hugging Face
Licencia: cc-by-nc-4.0

Casos de uso

Clasificación de videos
Detección de eventos en videos
Análisis de reacciones en videos