vivit-b-16x2-kinetics400-ft-76388

Temo27Anas
Clasificación de video

Este modelo es una versión afinada de google/vivit-b-16x2-kinetics400 en un conjunto de datos desconocido. Este modelo se clasifica en la categoría de Clasificación de Videos y utiliza Transformers. Los resultados en el conjunto de evaluación son: Pérdida: 0.9924 y Precisión: 0.5595.

Como usar

El modelo se utiliza para clasificación de videos. No tiene suficiente actividad para ser desplegado en la API de Inferencia (sin servidor) aún. Se puede desplegar en puntos finales de inferencia dedicados.

El modelo fue entrenado con los siguientes hiperparámetros:
  • learning_rate: 5e-05
  • train_batch_size: 8
  • eval_batch_size: 8
  • seed: 42
  • optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
  • lr_scheduler_type: linear
  • lr_scheduler_warmup_ratio: 0.1
  • training_steps: 5500

Funcionalidades

Clasificación de Videos
Transformers
Safetensors
Entrenado con Trainer
Utiliza Adam con betas=(0.9, 0.999) y epsilon=1e-08
Programador de tasa de aprendizaje lineal con una relación de calentamiento del 10%
Utiliza Pytorch 1.13.0+cu117
37.9M parámetros
Tipo de tensor F32

Casos de uso

Clasificación de videos
Análisis de contenido de video
Reconocimiento de acciones en videos