cross-encoder/quora-roberta-base

cross-encoder

Clasificación de texto

Cross-Encoder para la Detección de Preguntas Duplicadas en Quora. Este modelo fue entrenado utilizando la clase Cross-Encoder de SentenceTransformers. Fue entrenado en el conjunto de datos de Preguntas Duplicadas de Quora. El modelo predice una puntuación entre 0 y 1 sobre la probabilidad de que las dos preguntas dadas sean duplicadas. Nota: El modelo no es adecuado para estimar la similitud de preguntas, por ejemplo, las dos preguntas 'Cómo aprender Java' y 'Cómo aprender Python' resultarán en una puntuación bastante baja, ya que no son duplicadas.

Como usar

Los modelos pre-entrenados se pueden usar de la siguiente manera:
from sentence_transformers import CrossEncoder
model = CrossEncoder('model_name')
scores = model.predict([('Pregunta 1', 'Pregunta 2'), ('Pregunta 3', 'Pregunta 4')])

También puedes usar este modelo sin sentence_transformers y simplemente usando la clase AutoModel de Transformers.

Funcionalidades

Clasificación de texto
Transformers
PyTorch
JAX
Modelo RoBERTa
Compatible con AutoTrain
Compatible con Puntos de Inferencia
Licencia: Apache-2.0
Región: EE. UU.

Casos de uso

Detectar preguntas duplicadas en plataformas como Quora