VasylKhoroshcho/xclip-base-patch16-zero-shot
VasylKhoroshcho
Clasificación de video
X-CLIP es una extensión mínima de CLIP para la comprensión general del lenguaje de video. El modelo está entrenado de manera contrastiva en pares de (video, texto). Esto permite que el modelo se use para tareas como clasificación de video sin entrenamiento previo, poco entrenado o completamente supervisada y recuperación de video-texto.
Como usar
Para ejemplos de código, nos remitimos a la documentación.
Para determinar cuán bien un texto se ajusta a un video dado, puedes usar el modelo sin procesar. Consulta el hub de modelos para buscar versiones ajustadas a una tarea que te interese.
Funcionalidades
- Clasificación de video sin entrenamiento previo
- Clasificación de video poco entrenada
- Clasificación de video completamente supervisada
- Recuperación de video-texto
Casos de uso
- Clasificación de videos sin entrenar
- Clasificación de videos poco entrenada
- Clasificación de videos completamente supervisada
- Recuperación de video a texto