videomae-base-finetuned-kinetics_m_v7

Mena55
Clasificación de video

Este modelo es una versión ajustada de MCG-NJU/videomae-base-finetuned-kinetics en un conjunto de datos desconocido. Ofrece los siguientes resultados en el conjunto de evaluación: eval_loss: 0.0001, eval_accuracy: 1.0, eval_runtime: 28.915, eval_samples_per_second: 0.692, eval_steps_per_second: 0.346, epoch: 1.33, step: 530.

Como usar

El modelo está diseñado para ser utilizado en tareas de clasificación de video. A continuación, se presentan los hiperparámetros utilizados durante el entrenamiento:

learning_rate: 5e-05
train_batch_size: 2
eval_batch_size: 2
seed: 42
optimizer: Adam con betas=(0.9, 0.999) y epsilon=1e-08
lr_scheduler_type: linear
lr_scheduler_warmup_ratio: 0.1
training_steps: 792

Para su implementación, se usaron las siguientes versiones de frameworks:

Transformers 4.38.1
Pytorch 2.1.0+cu121
Datasets 2.18.0
Tokenizers 0.15.2

Funcionalidades

Clasificación de Video
Transformers
TensorBoard
Safetensors
Generado a partir de Trainer

Casos de uso

Clasificación automática de videos
Análisis de contenido multimedia
Etiquetado de videos para bases de datos