passage-ranker-v1-L-en

sinequa
Clasificación de texto

Este modelo es un clasificador de pasajes desarrollado por Sinequa. Produce una puntuación de relevancia dada una pareja consulta-pasaje y se utiliza para ordenar los resultados de búsqueda.

Como usar

Para usar este modelo, asegúrese de tener la versión mínima de Sinequa 11.10.0. Para usar modelos en FP16 y GPUs con capacidad de cómputo CUDA de 8.9+ (como NVIDIA L4), se requiere la versión mínima de Sinequa 11.11.0.

Requisitos:

  • Versión mínima de Sinequa: 11.10.0
  • Versión mínima de Sinequa para usar modelos FP16 y GPUs con capacidad de cómputo CUDA de 8.9+: 11.11.0
  • Capacidad de cómputo CUDA: superior a 5.0 (superior a 6.0 para el uso de FP16)

Memoria de GPU utilizada:

  • Tipo de cuantización: FP16 - 550 MiB
  • Tipo de cuantización: FP32 - 1100 MiB

Tiempos de inferencia: | GPU | Tipo de Cuantización | Tamaño del lote 1 | Tamaño del lote 32 | | --- | ------------------ | ------------------- | ------------------- | | NVIDIA A10 | FP16 | 2 ms | 27 ms | | NVIDIA A10 | FP32 | 4 ms | 82 ms | | NVIDIA T4 | FP16 | 3 ms | 63 ms | | NVIDIA T4 | FP32 | 13 ms | 342 ms | | NVIDIA L4 | FP16 | 2 ms | 39 ms | | NVIDIA L4 | FP32 | 5 ms | 119 ms |

Funcionalidades

Puntuación de relevancia (NDCG@10): 0.466
Número de parámetros: 109 millones
Modelo base de lenguaje: BERT-Base en inglés
Insensible a mayúsculas y acentos
Procedimiento de entrenamiento: MonoBERT

Casos de uso

Clasificación de pasajes
Ordenamiento de resultados de búsqueda
Evaluación de la relevancia de consultas y pasajes