pasaje-ranker-v1-XS-multilingüe
sinequa
Clasificación de texto
Este modelo es un rankeador de pasajes desarrollado por Sinequa. Produce una puntuación de relevancia dada una pareja de consulta-pasaje y se utiliza para ordenar los resultados de búsqueda.
Como usar
Para usar este modelo, puedes seguir las siguientes configuraciones de tiempos de inferencia y uso de memoria de GPU:
GPU
Tipo de cuantización
Tamaño de lote 1
Tamaño de lote 32
NVIDIA A10
FP16
1 ms
2 ms
NVIDIA A10
FP32
1 ms
7 ms
NVIDIA T4
FP16
1 ms
6 ms
NVIDIA T4
FP32
1 ms
20 ms
NVIDIA L4
FP16
1 ms
3 ms
NVIDIA L4
FP32
2 ms
8 ms
Funcionalidades
- Clasificación de texto
- Transformers
- PyTorch
- Soporte multilingüe
Casos de uso
- Ordenar los resultados de búsqueda dada una consulta
- Clasificación de relevancia de pasajes