vivit-b-16x2-kinetics400-finetuned-vivit-diagnose

yangboyuan
Clasificación de video

Este modelo es una versión afinada del google/vivit-b-16x2-kinetics400 en un conjunto de datos desconocido. Logra los siguientes resultados en el conjunto de evaluación: Pérdida: 1.8988, Precisión: 0.6953. Utiliza el optimizador Adam con betas=0.9,0.999 y epsilon=1e-08. También emplea un programador de tasa de aprendizaje de tipo lineal con una proporción de calentamiento del 0.1. El modelo se entrenó durante 3430 pasos. Se basa en las versiones de marcos Transformers 4.42.4, Pytorch 2.0.1+cu117, Datasets 2.20.0, y Tokenizers 0.19.1.

Como usar

Aquí se describen los hiperparámetros utilizados durante el entrenamiento:

  • Tasa de aprendizaje: 5e-05
  • Tamaño del lote de entrenamiento: 1
  • Tamaño del lote de evaluación: 1
  • Semilla: 42
  • Optimizador: Adam con betas=(0.9,0.999) y epsilon=1e-08
  • Tipo de programador de tasa de aprendizaje: lineal
  • Proporción de calentamiento del programador: 0.1
  • Pasos de entrenamiento: 3430

Resultados del Entrenamiento

  • Pérdida de entrenamiento: 1.8386

  • Época: 0.1

  • Paso: 343

  • Pérdida de validación: 1.5448

  • Precisión: 0.5448

  • Pérdida de entrenamiento: 1.1419

  • Época: 1.1

  • Paso: 686

  • Pérdida de validación: 1.2918

  • Precisión: 0.5412

  • Pérdida de entrenamiento: 0.778

  • Época: 2.1

  • Paso: 1029

  • Pérdida de validación: 1.4229

  • Precisión: 0.7240

  • Pérdida de entrenamiento: 0.7591

  • Época: 3.1

  • Paso: 1372

  • Pérdida de validación: 1.5418

  • Precisión: 0.6918

  • Pérdida de entrenamiento: 0.8103

  • Época: 4.1

  • Paso: 1715

  • Pérdida de validación: 1.3608

  • Precisión: 0.6810

  • Pérdida de entrenamiento: 0.3701

  • Época: 5.1

  • Paso: 2058

  • Pérdida de validación: 1.6575

  • Precisión: 0.6810

  • Pérdida de entrenamiento: 0.2027

  • Época: 6.1

  • Paso: 2401

  • Pérdida de validación: 1.8233

  • Precisión: 0.6774

  • Pérdida de entrenamiento: 0.0002

  • Época: 7.1

  • Paso: 2744

  • Pérdida de validación: 1.9324

  • Precisión: 0.6738

  • Pérdida de entrenamiento: 0.1793

  • Época: 8.1

  • Paso: 3087

  • Pérdida de validación: 1.8483

  • Precisión: 0.6953

  • Pérdida de entrenamiento: 0.0007

  • Época: 9.1

  • Paso: 3430

  • Pérdida de validación: 1.8988

  • Precisión: 0.6953

Funcionalidades

Clasificación de Video
Transformers
TensorBoard
Safetensors

Casos de uso

Clasificación de videos
Análisis de desempeño en videos
Identificación de patrones en grabaciones de video