vectorizador.frambuesa

sinequa

Similitud de oraciones

Este modelo es un vectorizador desarrollado por Sinequa. Produce un vector de incrustación dado un pasaje o una consulta. Los vectores de los pasajes se almacenan en nuestro índice de vectores y el vector de consulta se utiliza en el momento de la consulta para buscar pasajes relevantes en el índice.

Como usar

Este modelo se puede utilizar para varias tareas de procesamiento de lenguaje natural como la similitud de oraciones y la extracción de características. A continuación, se muestra un ejemplo de uso en código Markdown:
from transformers import AutoModelForMaskedLM, AutoTokenizer

tokenizer = AutoTokenizer.from_pretrained('sinequa/vectorizer.raspberry')
model = AutoModelForMaskedLM.from_pretrained('sinequa/vectorizer.raspberry')

input_text = 'Das ist eine glückliche Person'
input_ids = tokenizer(input_text, return_tensors='pt').input_ids
outputs = model(input_ids)
print(outputs)

Funcionalidades

Transformers
PyTorch
xlm-roberta
Rellenar huecos (fill-mask)
Extracción de características
Inferencia de incrustaciones de textos
Endpoints de inferencia
Compatible con AutoTrain

Casos de uso

Similitud de oraciones
Extracción de características textuales
Rellenar huecos en oraciones
Construcción de vectores de incrustación desde consultes y pasajes
Indexación y consulta eficiente de pasajes relevantes en un índice