vivit-b-16x2-kinetics400-ft-6906

Temo27Anas
Clasificación de video

Este modelo es una versión afinada de google/vivit-b-16x2-kinetics400 en un conjunto de datos desconocido. Este modelo se utiliza para la clasificación de videos utilizando transformadores. Durante el entrenamiento, se alcanzaron los siguientes resultados en el conjunto de evaluación: Pérdida: 0.8594, Precisión: 0.6102.

Como usar

A continuación, se muestran los hiperparámetros utilizados durante el entrenamiento:

learning_rate: 5e-05
train_batch_size: 4
eval_batch_size: 4
seed: 42
optimizer: Adam con betas=(0.9,0.999) y epsilon=1e-08
lr_scheduler_type: linear
lr_scheduler_warmup_ratio: 0.1
training_steps: 880

Los resultados del entrenamiento son los siguientes:

Entrenamiento Pérdida
Epoch
Paso
Pérdida de Validación
Precisión

1.0172
0.2511
221
0.9912
0.5317

1.0646
1.2511
442
0.9282
0.5732

0.7174
2.2511
663
0.8824
0.6041

0.8446
3.2466
880
0.8700
0.6120

Funcionalidades

Clasificación de videos
Transformadores
Safetensors
Generado a partir de Trainer
Puntos finales de inferencia

Casos de uso

Clasificación de videos
Análisis de contenido multimedia
Etiquetado automático de videos