vivit-b-16x2-conjunto-de-datos-colectados
yehiawp4
Clasificación de video
Este modelo es una versión ajustada de google/vivit-b-16x2-kinetics400 en un conjunto de datos desconocido. Logra los siguientes resultados en el conjunto de evaluación: Pérdida: 0.2578, Precisión: 0.9610. Se utilizó Adam como optimizador con betas=(0.9,0.999) y epsilon=1e-08, junto con un programador de tasa de aprendizaje de tipo lineal y una proporción de calentamiento de 0.1.
Como usar
Aún se necesita más información sobre cómo utilizar este modelo. Los hiperparámetros utilizados durante el entrenamiento incluyen:
learning_rate: 5e-05
train_batch_size: 2
eval_batch_size: 2
seed: 42
optimizer: Adam con betas=(0.9,0.999) y epsilon=1e-08
lr_scheduler_type: lineal
lr_scheduler_warmup_ratio: 0.1
training_steps: 14020
Funcionalidades
- Clasificación de video
- Transformadores
- Safetensors
- Generado a partir de Trainer
- Inferencia Endpoints
Casos de uso
- Clasificación de videos para aplicaciones de análisis de contenido
- Uso en proyectos de investigación que requieren tecnologías avanzadas de procesamiento de videos
- Integración en sistemas de vigilancia automatizada para identificar eventos y acciones