I3D Kinetics-400
Mouwiya
Clasificación de video
Este modelo es una versión afinada del modelo Inflated 3D Convnet para reconocimiento de acciones, entrenado en el conjunto de datos Kinetics-400. El modelo I3D (Inflated 3D Convnet) está diseñado para tareas de clasificación de videos. Extiende convoluciones 2D a 3D, lo que permite al modelo capturar características espaciotemporales de los fotogramas de video.
Como usar
from transformers import pipeline
model = pipeline("video-classification", model="Mouwiya/i3d-kinetics-400")
# Ejemplo de ruta de video
video_path = "path_to_your_video.mp4"
# Realizar clasificación de video
results = model(video_path)
print(results)
Funcionalidades
- Reconocimiento de acciones en videos
- Extiende convoluciones 2D a 3D
- Captura características espaciotemporales
Casos de uso
- Clasificación de actividades humanas en videos