videomae-base-finetuned-IEMOCAP_2

minoosh
Clasificación de video

Este modelo es una versión ajustada de MCG-NJU/videomae-base en un conjunto de datos desconocido. Logra los siguientes resultados en el conjunto de evaluación: Pérdida: 1.3381, Precisión: 0.3434. No se proporciona más información sobre usos previstos y limitaciones, datos de entrenamiento y evaluación, ni resultados de entrenamiento.

Como usar

Parámetros de Entrenamiento

Los siguientes hiperparámetros fueron utilizados durante el entrenamiento:

  • learning_rate: 5e-05
  • train_batch_size: 8
  • eval_batch_size: 8
  • seed: 42
  • optimizer: Adam con betas=(0.9,0.999) y epsilon=1e-08
  • lr_scheduler_type: linear
  • lr_scheduler_warmup_ratio: 0.1
  • training_steps: 4500

Resultados de Entrenamiento

| Pérdida | Época | Paso | Pérdida de Validación | Precisión | |---------|-------|------|-----------------------|-----------| | 1.3215 | 0.1 | 451 | 1.4351 | 0.2622 | | 1.3236 | 1.1 | 902 | 1.3517 | 0.3579 | | 1.2642 | 2.1 | 1353 | 1.4280 | 0.2982 | | 1.2741 | 3.1 | 1804 | 1.3943 | 0.3012 | | 1.2655 | 4.1 | 2255 | 1.3665 | 0.3311 | | 1.1476 | 5.1 | 2706 | 1.3808 | 0.3293 | | 1.2231 | 6.1 | 3157 | 1.3216 | 0.3573 | | 1.2715 | 7.1 | 3608 | 1.3162 | 0.3720 | | 1.3088 | 8.1 | 4059 | 1.2985 | 0.3982 | | 1.2636 | 9.1 | 4500 | 1.2666 | 0.4098 |

Versiones del Framework

  • Transformers 4.30.2
  • Pytorch 2.0.1+cu118
  • Datasets 2.13.0
  • Tokenizers 0.13.3

Funcionalidades

Clasificación de Video
Transformers
PyTorch
videomae
Generado a partir de Trainer
Endpoints de Inferencia

Casos de uso

Clasificación de emociones en videos utilizando el dataset IEMOCAP