vivit-b-16x2-kinetics400-finetuned-ucf101-subset-without-preentrenado
JackWong0911
Clasificación de video
Este modelo es una versión ajustada de google/vivit-b-16x2-kinetics400 en un conjunto de datos desconocido. Alcanza los siguientes resultados en el conjunto de evaluación: Pérdida: 2.1644, Precisión: 0.4138.
Como usar
Para usar este modelo, necesitarás configurar algunos hiperparámetros específicos utilizados durante el entrenamiento.
# Ejemplo de configuración de hiperparámetros
evaluacion_set='validation_set_path'
resultados=evaluate(
model=model,
inputs=evaluacion_set,
hyperparameters={
'learning_rate': 5e-05,
'train_batch_size': 1,
'eval_batch_size': 1,
'seed': 42,
'optimizer': 'Adam',
'betas': (0.9,0.999),
'epsilon': 1e-08,
'lr_scheduler_type': 'linear',
'lr_scheduler_warmup_ratio': 0.1,
'training_steps': 3000
})
resultados
Funcionalidades
- Clasificación de video
- Transformers
- TensorBoard
- Safetensors
- Generado a partir de Trainer
- Endpoints de inferencia
Casos de uso
- Clasificación de videos en varios tipos, como deportes, noticias, entretenimiento, etc.
- Aplicaciones en sistemas de vigilancia para reconocer actividades específicas.
- Análisis de contenido multimedia para recomendaciones personalizadas.
- Monitoreo de medios sociales para identificar temas y emociones en videos.