vectorizer.vanilla

sinequa
Similitud de oraciones

Este modelo es un vectorizador desarrollado por Sinequa. Produce un vector de embebido dado un pasaje o una consulta. Los vectores de pasajes se almacenan en nuestro índice vectorial y el vector de consulta se utiliza en el momento de la consulta para buscar pasajes relevantes en el índice.

Como usar

Funcionalidades

Modelo base: English MiniLM-L6-H384
Insensible a mayúsculas y acentos
Dimensiones de salida: 256 (reducido con una capa densa adicional)
Número de parámetros: 23 millones

Casos de uso

Extracción de características
Inferencia de embeddings de texto
Búsqueda de pasajes relevantes en un índice