Athit_Timesformer_32PS
mbushee
Clasificación de video
Modelo TimeSformer preentrenado en Kinetics-400. Fue presentado en el artículo 'TimeSformer: Is Space-Time Attention All You Need for Video Understanding?' por Tong et al. y lanzado por primera vez en este repositorio. Puedes utilizar el modelo para la clasificación de videos en una de las 400 etiquetas posibles de Kinetics-400.
Como usar
Aquí te mostramos cómo usar este modelo para clasificar un video:
from transformers import AutoImageProcessor, TimesformerForVideoClassification
import numpy as np
import torch
video = list(np.random.randn(8, 3, 224, 224))
processor = AutoImageProcessor.from_pretrained("facebook/timesformer-base-finetuned-k400")
model = TimesformerForVideoClassification.from_pretrained("facebook/timesformer-base-finetuned-k400")
inputs = processor(video, return_tensors="pt")
with torch.no_grad():
outputs = model(**inputs)
logits = outputs.logits
predicted_class_idx = logits.argmax(-1).item()
print("Predicted class:", model.config.id2label[predicted_class_idx])
Funcionalidades
- Clasificación de videos
- Transformers
- PyTorch
- TimeSformer
Casos de uso
- Clasificación de videos en uno de los 400 posibles en Kinetics-400