vivit-b-16x2-kinetics400-ft-6906
Temo27Anas
Clasificación de video
Este modelo es una versión afinada de google/vivit-b-16x2-kinetics400 en un conjunto de datos desconocido. Este modelo se utiliza para la clasificación de videos utilizando transformadores. Durante el entrenamiento, se alcanzaron los siguientes resultados en el conjunto de evaluación: Pérdida: 0.8594, Precisión: 0.6102.
Como usar
A continuación, se muestran los hiperparámetros utilizados durante el entrenamiento:
learning_rate: 5e-05
train_batch_size: 4
eval_batch_size: 4
seed: 42
optimizer: Adam con betas=(0.9,0.999) y epsilon=1e-08
lr_scheduler_type: linear
lr_scheduler_warmup_ratio: 0.1
training_steps: 880
Los resultados del entrenamiento son los siguientes:
Entrenamiento Pérdida
Epoch
Paso
Pérdida de Validación
Precisión
1.0172
0.2511
221
0.9912
0.5317
1.0646
1.2511
442
0.9282
0.5732
0.7174
2.2511
663
0.8824
0.6041
0.8446
3.2466
880
0.8700
0.6120
Funcionalidades
- Clasificación de videos
- Transformadores
- Safetensors
- Generado a partir de Trainer
- Puntos finales de inferencia
Casos de uso
- Clasificación de videos
- Análisis de contenido multimedia
- Etiquetado automático de videos