vvt-gs-rot-flip-wtoken-f198-4.4-h768-t8.16.16
Temo27Anas
Clasificación de video
Este modelo es una versión ajustada de google/vivit-b-16x2-kinetics400 en un conjunto de datos desconocido. Alcanza los siguientes resultados en el conjunto de evaluación: - Pérdida de evaluación (eval_loss): 0.7628 - Precisión de evaluación (eval_accuracy): 0.6720 - Tiempo de ejecución de evaluación (eval_runtime): 237.6048 - Muestras por segundo en evaluación (eval_samples_per_second): 0.795 - Pasos por segundo en evaluación (eval_steps_per_second): 0.202 - Época: 1.0002 - Paso: 5501
Como usar
Más información necesaria
Funcionalidades
- Transformers
- Safetensors
- Video Classification
- Inference Endpoints
Casos de uso
- Clasificación de videos
- Puntos finales de inferencia