Clasificación de Video con una Arquitectura CNN-RNN

keras-io

Clasificación de video

Entrenamiento de un clasificador de videos con aprendizaje por transferencia y un modelo recurrente en el conjunto de datos UCF101. Este ejemplo demuestra la clasificación de videos, un caso de uso importante con aplicaciones en recomendaciones, seguridad, y más. Utilizaremos el conjunto de datos UCF101 para construir nuestro clasificador de videos. El conjunto de datos consta de videos categorizados en diferentes acciones, como disparo de cricket, golpe, ciclismo, etc. Este conjunto de datos se usa comúnmente para construir reconocedores de acciones, que son una aplicación de la clasificación de videos. Un video consta de una secuencia ordenada de fotogramas. Cada fotograma contiene información espacial y la secuencia de esos fotogramas contiene información temporal. Para modelar ambos aspectos, usamos una arquitectura híbrida que consta de convoluciones (para el procesamiento espacial) y capas recurrentes (para el procesamiento temporal). Específicamente, utilizaremos una Red Neuronal Convolucional (CNN) y una Red Neuronal Recurrente (RNN) que consta de capas GRU. Este tipo de arquitectura híbrida es conocida popularmente como CNN-RNN.

Como usar

from tensorflow.keras.models import load_model
model = load_model('ruta/al/modelo')

# Código de ejemplo para la carga y uso del modelo
# ...

Funcionalidades

Clasificación de videos utilizando aprendizaje por transferencia.
Uso de UCF101, un conjunto de datos estándar para la clasificación de acciones.
Arquitectura híbrida con CNN para el procesamiento espacial y RNN para el procesamiento temporal.
Modelo recurrente compuesto por capas GRU.

Casos de uso

Recomendaciones de videos.
Seguridad y vigilancia.
Reconocimiento de acciones en videos.