vivit-b-16x2-conjunto-de-datos-colectados

yehiawp4

Clasificación de video

Este modelo es una versión ajustada de google/vivit-b-16x2-kinetics400 en un conjunto de datos desconocido. Logra los siguientes resultados en el conjunto de evaluación: Pérdida: 0.2578, Precisión: 0.9610. Se utilizó Adam como optimizador con betas=(0.9,0.999) y epsilon=1e-08, junto con un programador de tasa de aprendizaje de tipo lineal y una proporción de calentamiento de 0.1.

Como usar

Aún se necesita más información sobre cómo utilizar este modelo. Los hiperparámetros utilizados durante el entrenamiento incluyen:
learning_rate: 5e-05
train_batch_size: 2
eval_batch_size: 2
seed: 42
optimizer: Adam con betas=(0.9,0.999) y epsilon=1e-08
lr_scheduler_type: lineal
lr_scheduler_warmup_ratio: 0.1
training_steps: 14020

Funcionalidades

Clasificación de video
Transformadores
Safetensors
Generado a partir de Trainer
Inferencia Endpoints

Casos de uso

Clasificación de videos para aplicaciones de análisis de contenido
Uso en proyectos de investigación que requieren tecnologías avanzadas de procesamiento de videos
Integración en sistemas de vigilancia automatizada para identificar eventos y acciones