vectorizador.frambuesa
sinequa
Similitud de oraciones
Este modelo es un vectorizador desarrollado por Sinequa. Produce un vector de incrustación dado un pasaje o una consulta. Los vectores de los pasajes se almacenan en nuestro índice de vectores y el vector de consulta se utiliza en el momento de la consulta para buscar pasajes relevantes en el índice.
Como usar
Este modelo se puede utilizar para varias tareas de procesamiento de lenguaje natural como la similitud de oraciones y la extracción de características. A continuación, se muestra un ejemplo de uso en código Markdown:
from transformers import AutoModelForMaskedLM, AutoTokenizer
tokenizer = AutoTokenizer.from_pretrained('sinequa/vectorizer.raspberry')
model = AutoModelForMaskedLM.from_pretrained('sinequa/vectorizer.raspberry')
input_text = 'Das ist eine glückliche Person'
input_ids = tokenizer(input_text, return_tensors='pt').input_ids
outputs = model(input_ids)
print(outputs)
Funcionalidades
- Transformers
- PyTorch
- xlm-roberta
- Rellenar huecos (fill-mask)
- Extracción de características
- Inferencia de incrustaciones de textos
- Endpoints de inferencia
- Compatible con AutoTrain
Casos de uso
- Similitud de oraciones
- Extracción de características textuales
- Rellenar huecos en oraciones
- Construcción de vectores de incrustación desde consultes y pasajes
- Indexación y consulta eficiente de pasajes relevantes en un índice