videomae-base-finetuned-numbers

latif98

Clasificación de video

Este modelo es una versión afinada de MCG-NJU/videomae-base en un conjunto de datos desconocido. Logra los siguientes resultados en el conjunto de evaluación: - Pérdida: 0.3433 - Exactitud: 0.8222 - F1: 0.8015 - Precisión: 0.8762 - Recall: 0.8182

Como usar

A continuación se presentan los hiperparámetros utilizados durante el entrenamiento:
learning_rate: 5e-05
train_batch_size: 4
eval_batch_size: 4
seed: 42
optimizer: Adam con betas=(0.9,0.999) y epsilon=1e-08
lr_scheduler_type: linear
lr_scheduler_warmup_ratio: 0.1
training_steps: 176

Versiones de framework:

Transformers 4.40.0
Pytorch 2.1.0+cu121
Datasets 2.18.0
Tokenizers 0.19.1

Código para usar el modelo:
# Cargar el modelo
from transformers import AutoModelForVideoClassification, AutoTokenizer

model_name = "latif98/videomae-base-finetuned-numbers"

model = AutoModelForVideoClassification.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)

Funcionalidades

Clasificación de video
Transformadores
TensorBoard
Safetensors

Casos de uso

Clasificación de secuencias de video
Análisis de contenido de video
Aplicaciones multimedia basadas en IA