vivit-b-16x2-kinetics400-ft-76388
Temo27Anas
Clasificación de video
Este modelo es una versión afinada de google/vivit-b-16x2-kinetics400 en un conjunto de datos desconocido. Este modelo se clasifica en la categoría de Clasificación de Videos y utiliza Transformers. Los resultados en el conjunto de evaluación son: Pérdida: 0.9924 y Precisión: 0.5595.
Como usar
El modelo se utiliza para clasificación de videos. No tiene suficiente actividad para ser desplegado en la API de Inferencia (sin servidor) aún. Se puede desplegar en puntos finales de inferencia dedicados.
El modelo fue entrenado con los siguientes hiperparámetros:
- learning_rate: 5e-05
- train_batch_size: 8
- eval_batch_size: 8
- seed: 42
- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
- lr_scheduler_type: linear
- lr_scheduler_warmup_ratio: 0.1
- training_steps: 5500
Funcionalidades
- Clasificación de Videos
- Transformers
- Safetensors
- Entrenado con Trainer
- Utiliza Adam con betas=(0.9, 0.999) y epsilon=1e-08
- Programador de tasa de aprendizaje lineal con una relación de calentamiento del 10%
- Utiliza Pytorch 1.13.0+cu117
- 37.9M parámetros
- Tipo de tensor F32
Casos de uso
- Clasificación de videos
- Análisis de contenido de video
- Reconocimiento de acciones en videos