cross-encoder/ms-marco-MiniLM-L-4-v2

cross-encoder
Clasificación de texto

Este modelo fue entrenado en la tarea de Clasificación de Pasajes de MS Marco. Puede ser utilizado para Recuperación de Información: Dada una consulta, codifique la consulta con todos los pasajes posibles (por ejemplo, recuperados con ElasticSearch). Luego, ordene los pasajes en orden decreciente. Ver SBERT.net Retrieve & Re-rank para más detalles.

Como usar

Uso con Transformers

from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch

model = AutoModelForSequenceClassification.from_pretrained('model_name')
tokenizer = AutoTokenizer.from_pretrained('model_name')

features = tokenizer(['¿Cuántas personas viven en Berlín?', '¿Cuántas personas viven en Berlín?'], ['Berlín tiene una población de 3,520,031 habitantes registrados en un área de 891.82 kilómetros cuadrados.', 'Nueva York es famosa por el Museo Metropolitano de Arte.'], padding=True, truncation=True, return_tensors="pt")

model.eval()
with torch.no_grad():
    scores = model(**features).logits
    print(scores)

Uso con SentenceTransformers

from sentence_transformers import CrossEncoder
model = CrossEncoder('model_name', max_length=512)
scores = model.predict([('Consulta', 'Párrafo1'), ('Consulta', 'Párrafo2'), ('Consulta', 'Párrafo3')])

Funcionalidades

Clasificación de texto
Transformers
PyTorch
JAX
bert
Puntos de Inferencia

Casos de uso

Recuperación de Información
Clasificación de pasajes
Relevancia de documentos
Reranking de pasajes