videomae-base-finetuned-IEMOCAP_2
Este modelo es una versión ajustada de MCG-NJU/videomae-base en un conjunto de datos desconocido. Logra los siguientes resultados en el conjunto de evaluación: Pérdida: 1.3381, Precisión: 0.3434. No se proporciona más información sobre usos previstos y limitaciones, datos de entrenamiento y evaluación, ni resultados de entrenamiento.
Como usar
Parámetros de Entrenamiento
Los siguientes hiperparámetros fueron utilizados durante el entrenamiento:
- learning_rate: 5e-05
- train_batch_size: 8
- eval_batch_size: 8
- seed: 42
- optimizer: Adam con betas=(0.9,0.999) y epsilon=1e-08
- lr_scheduler_type: linear
- lr_scheduler_warmup_ratio: 0.1
- training_steps: 4500
Resultados de Entrenamiento
| Pérdida | Época | Paso | Pérdida de Validación | Precisión |
|---------|-------|------|-----------------------|-----------|
| 1.3215 | 0.1 | 451 | 1.4351 | 0.2622 |
| 1.3236 | 1.1 | 902 | 1.3517 | 0.3579 |
| 1.2642 | 2.1 | 1353 | 1.4280 | 0.2982 |
| 1.2741 | 3.1 | 1804 | 1.3943 | 0.3012 |
| 1.2655 | 4.1 | 2255 | 1.3665 | 0.3311 |
| 1.1476 | 5.1 | 2706 | 1.3808 | 0.3293 |
| 1.2231 | 6.1 | 3157 | 1.3216 | 0.3573 |
| 1.2715 | 7.1 | 3608 | 1.3162 | 0.3720 |
| 1.3088 | 8.1 | 4059 | 1.2985 | 0.3982 |
| 1.2636 | 9.1 | 4500 | 1.2666 | 0.4098 |
Versiones del Framework
- Transformers 4.30.2
- Pytorch 2.0.1+cu118
- Datasets 2.13.0
- Tokenizers 0.13.3
Funcionalidades
- Clasificación de Video
- Transformers
- PyTorch
- videomae
- Generado a partir de Trainer
- Endpoints de Inferencia
Casos de uso
- Clasificación de emociones en videos utilizando el dataset IEMOCAP