VasylKhoroshcho/xclip-base-patch16-zero-shot

VasylKhoroshcho
Clasificación de video

X-CLIP es una extensión mínima de CLIP para la comprensión general del lenguaje de video. El modelo está entrenado de manera contrastiva en pares de (video, texto). Esto permite que el modelo se use para tareas como clasificación de video sin entrenamiento previo, poco entrenado o completamente supervisada y recuperación de video-texto.

Como usar

Para ejemplos de código, nos remitimos a la documentación.

Para determinar cuán bien un texto se ajusta a un video dado, puedes usar el modelo sin procesar. Consulta el hub de modelos para buscar versiones ajustadas a una tarea que te interese.

Funcionalidades

Clasificación de video sin entrenamiento previo
Clasificación de video poco entrenada
Clasificación de video completamente supervisada
Recuperación de video-texto

Casos de uso

Clasificación de videos sin entrenar
Clasificación de videos poco entrenada
Clasificación de videos completamente supervisada
Recuperación de video a texto