vvt-gs-rot-flip-wtoken-f198-4.4-h768-t8.16.16

Temo27Anas

Clasificación de video

Este modelo es una versión ajustada de google/vivit-b-16x2-kinetics400 en un conjunto de datos desconocido. Alcanza los siguientes resultados en el conjunto de evaluación: - Pérdida de evaluación (eval_loss): 0.7628 - Precisión de evaluación (eval_accuracy): 0.6720 - Tiempo de ejecución de evaluación (eval_runtime): 237.6048 - Muestras por segundo en evaluación (eval_samples_per_second): 0.795 - Pasos por segundo en evaluación (eval_steps_per_second): 0.202 - Época: 1.0002 - Paso: 5501

Como usar

Más información necesaria

Funcionalidades

Transformers
Safetensors
Video Classification
Inference Endpoints

Casos de uso

Clasificación de videos
Puntos finales de inferencia