pasaje-ranker-v1-XS-multilingüe

sinequa
Clasificación de texto

Este modelo es un rankeador de pasajes desarrollado por Sinequa. Produce una puntuación de relevancia dada una pareja de consulta-pasaje y se utiliza para ordenar los resultados de búsqueda.

Como usar

Para usar este modelo, puedes seguir las siguientes configuraciones de tiempos de inferencia y uso de memoria de GPU:

GPU
Tipo de cuantización
Tamaño de lote 1
Tamaño de lote 32

NVIDIA A10
FP16
1 ms
2 ms

NVIDIA A10
FP32
1 ms
7 ms

NVIDIA T4
FP16
1 ms
6 ms

NVIDIA T4
FP32
1 ms
20 ms

NVIDIA L4
FP16
1 ms
3 ms

NVIDIA L4
FP32
2 ms
8 ms

Funcionalidades

Clasificación de texto
Transformers
PyTorch
Soporte multilingüe

Casos de uso

Ordenar los resultados de búsqueda dada una consulta
Clasificación de relevancia de pasajes