vivit-b-16x2-kinetics400-finetuned-vivit-diagnose

yangboyuan

Clasificación de video

Este modelo es una versión afinada del google/vivit-b-16x2-kinetics400 en un conjunto de datos desconocido. Logra los siguientes resultados en el conjunto de evaluación: Pérdida: 1.8988, Precisión: 0.6953. Utiliza el optimizador Adam con betas=0.9,0.999 y epsilon=1e-08. También emplea un programador de tasa de aprendizaje de tipo lineal con una proporción de calentamiento del 0.1. El modelo se entrenó durante 3430 pasos. Se basa en las versiones de marcos Transformers 4.42.4, Pytorch 2.0.1+cu117, Datasets 2.20.0, y Tokenizers 0.19.1.

Como usar

Aquí se describen los hiperparámetros utilizados durante el entrenamiento:

Tasa de aprendizaje: 5e-05
Tamaño del lote de entrenamiento: 1
Tamaño del lote de evaluación: 1
Semilla: 42
Optimizador: Adam con betas=(0.9,0.999) y epsilon=1e-08
Tipo de programador de tasa de aprendizaje: lineal
Proporción de calentamiento del programador: 0.1
Pasos de entrenamiento: 3430

Resultados del Entrenamiento


Pérdida de entrenamiento: 1.8386


Época: 0.1


Paso: 343


Pérdida de validación: 1.5448


Precisión: 0.5448


Pérdida de entrenamiento: 1.1419


Época: 1.1


Paso: 686


Pérdida de validación: 1.2918


Precisión: 0.5412


Pérdida de entrenamiento: 0.778


Época: 2.1


Paso: 1029


Pérdida de validación: 1.4229


Precisión: 0.7240


Pérdida de entrenamiento: 0.7591


Época: 3.1


Paso: 1372


Pérdida de validación: 1.5418


Precisión: 0.6918


Pérdida de entrenamiento: 0.8103


Época: 4.1


Paso: 1715


Pérdida de validación: 1.3608


Precisión: 0.6810


Pérdida de entrenamiento: 0.3701


Época: 5.1


Paso: 2058


Pérdida de validación: 1.6575


Precisión: 0.6810


Pérdida de entrenamiento: 0.2027


Época: 6.1


Paso: 2401


Pérdida de validación: 1.8233


Precisión: 0.6774


Pérdida de entrenamiento: 0.0002


Época: 7.1


Paso: 2744


Pérdida de validación: 1.9324


Precisión: 0.6738


Pérdida de entrenamiento: 0.1793


Época: 8.1


Paso: 3087


Pérdida de validación: 1.8483


Precisión: 0.6953


Pérdida de entrenamiento: 0.0007


Época: 9.1


Paso: 3430


Pérdida de validación: 1.8988


Precisión: 0.6953

Funcionalidades

Clasificación de Video
Transformers
TensorBoard
Safetensors

Casos de uso

Clasificación de videos
Análisis de desempeño en videos
Identificación de patrones en grabaciones de video