crossencoder-electra-base-french-mmarcoFR

antoinelouis
Clasificación de texto

Este es un modelo de cross-encoder para el francés. Realiza atención cruzada entre un par de pregunta-párrafo y produce un puntaje de relevancia. El modelo debe ser usado como un reranker de búsqueda semántica: dado una consulta y un conjunto de pasajes potencialmente relevantes obtenidos por un eficiente sistema de recuperación de primera etapa (por ejemplo, BM25 o un biecoder denso ajustado con un solo vector), codifica cada par consulta-párrafo y ordena los pasajes en orden decreciente de relevancia según los puntajes predichos por el modelo.

Como usar

Uso con Sentence-Transformers

from sentence_transformers import CrossEncoder

pairs = [('Question', 'Paragraphe 1'), ('Question', 'Paragraphe 2') , ('Question', 'Paragraphe 3')]

model = CrossEncoder('antoinelouis/crossencoder-electra-base-french-mmarcoFR')
scores = model.predict(pairs)
print(scores)

Uso con FlagEmbedding

from FlagEmbedding import FlagReranker

pairs = [('Question', 'Paragraphe 1'), ('Question', 'Paragraphe 2') , ('Question', 'Paragraphe 3')]

reranker = FlagReranker('antoinelouis/crossencoder-electra-base-french-mmarcoFR')
scores = reranker.compute_score(pairs)
print(scores)

Uso con HuggingFace Transformers

import torch
from transformers import AutoTokenizer, AutoModelForSequenceClassification

pairs = [('Question', 'Paragraphe 1'), ('Question', 'Paragraphe 2') , ('Question', 'Paragraphe 3')]

tokenizer = AutoTokenizer.from_pretrained('antoinelouis/crossencoder-electra-base-french-mmarcoFR')
model = AutoModelForSequenceClassification.from_pretrained('antoinelouis/crossencoder-electra-base-french-mmarcoFR')
model.eval()

with torch.no_grad():
  inputs = tokenizer(pairs, padding=True, truncation=True, return_tensors='pt', max_length=512)
  scores = model(**inputs, return_dict=True).logits.view(-1, ).float()
  print(scores)

Funcionalidades

Clasificación de texto
sentence-transformers
safetensors
unicamp-dl/mmarco
francés
reranking de pasajes
resultados de evaluación

Casos de uso

Reordenar resultados de búsqueda semántica
Rankeo de pasajes en función de su relevancia
Evaluación de la pertinencia de los documentos recuperados en búsquedas