I3D Kinetics-400

Mouwiya

Clasificación de video

Este modelo es una versión afinada del modelo Inflated 3D Convnet para reconocimiento de acciones, entrenado en el conjunto de datos Kinetics-400. El modelo I3D (Inflated 3D Convnet) está diseñado para tareas de clasificación de videos. Extiende convoluciones 2D a 3D, lo que permite al modelo capturar características espaciotemporales de los fotogramas de video.

Como usar

from transformers import pipeline

model = pipeline("video-classification", model="Mouwiya/i3d-kinetics-400")

# Ejemplo de ruta de video
video_path = "path_to_your_video.mp4"

# Realizar clasificación de video
results = model(video_path)
print(results)

Funcionalidades

Reconocimiento de acciones en videos
Extiende convoluciones 2D a 3D
Captura características espaciotemporales

Casos de uso

Clasificación de actividades humanas en videos