vivit-b-16x2-kinetics400-finetuned-ucf101-subset-without-preentrenado

JackWong0911

Clasificación de video

Este modelo es una versión ajustada de google/vivit-b-16x2-kinetics400 en un conjunto de datos desconocido. Alcanza los siguientes resultados en el conjunto de evaluación: Pérdida: 2.1644, Precisión: 0.4138.

Como usar

Para usar este modelo, necesitarás configurar algunos hiperparámetros específicos utilizados durante el entrenamiento.
# Ejemplo de configuración de hiperparámetros
evaluacion_set='validation_set_path'
resultados=evaluate(
    model=model,
    inputs=evaluacion_set,
    hyperparameters={
        'learning_rate': 5e-05,
        'train_batch_size': 1,
        'eval_batch_size': 1,
        'seed': 42,
        'optimizer': 'Adam',
        'betas': (0.9,0.999),
        'epsilon': 1e-08,
        'lr_scheduler_type': 'linear',
        'lr_scheduler_warmup_ratio': 0.1,
        'training_steps': 3000
    })
resultados

Funcionalidades

Clasificación de video
Transformers
TensorBoard
Safetensors
Generado a partir de Trainer
Endpoints de inferencia

Casos de uso

Clasificación de videos en varios tipos, como deportes, noticias, entretenimiento, etc.
Aplicaciones en sistemas de vigilancia para reconocer actividades específicas.
Análisis de contenido multimedia para recomendaciones personalizadas.
Monitoreo de medios sociales para identificar temas y emociones en videos.