videomae-base-finetuned-ucf101-subset

Anukul-02
Clasificación de video

Este modelo es una versión afinada de MCG-NJU/videomae-base en un conjunto de datos desconocido. Logra los siguientes resultados en el conjunto de evaluación: Pérdida: 1.1702 y Precisión: 0.7817.

Como usar

El siguiente hiperparámetros fueron utilizados durante el entrenamiento:


- learning_rate: 5e-05
- train_batch_size: 1
- eval_batch_size: 1
- seed: 42
- optimizer: Adam con betas=(0.9,0.999) y epsilon=1e-08
- lr_scheduler_type: linear
- lr_scheduler_warmup_ratio: 0.1
- training_steps: 1620

Resultados del entrenamiento:


| Epoch | Paso | Pérdida de Validación | Precisión |
|-------|------|-----------------------|-----------|
| 0.17  | 270  | 2.3796                | 0.4879    |
| 1.17  | 540  | 1.4838                | 0.6812    |
| 2.17  | 810  | 1.0878                | 0.7391    |
| 3.17  | 1080 | 1.3479                | 0.7295    |
| 4.17  | 1350 | 0.8615                | 0.8261    |
| 5.17  | 1620 | 0.6128                | 0.8551    |

Versiones de frameworks:


- Transformers 4.35.2
- Pytorch 2.1.0+cu118
- Datasets 2.15.0
- Tokenizers 0.15.0

Funcionalidades

Clasificación de video
Transformers
TensorBoard
Safetensors
Generado a partir de Trainer
Puntos finales de inferencia

Casos de uso

Clasificación de videos en aplicaciones multimedia
Análisis de contenido de video para marketing
Monitoreo de seguridad a través de videos