rubert-base-cased-conversational-paraphrase-v1

s-nlp
Clasificación de texto

Este es un modelo ruBERT-conversacional entrenado en una mezcla de 3 conjuntos de datos de detección de paráfrasis: - ru_paraphraser (con las clases -1 y 0 combinadas) - RuPAWS - Un conjunto de datos que contiene una evaluación mediante crowdsourcing de la preservación del contenido en la desintoxicación de texto ruso por Dementieva et al, 2022. El modelo puede usarse para evaluar la similitud semántica de oraciones en ruso. Consulte también la documentación de SkolkovoInstitute/ruRoberta-large-paraphrase-v1 que tiene un mejor desempeño en esta tarea.

Como usar

Parámetros de entrenamiento:

optimizer: Adam
lr=1e-5
batch_size=32
epochs=3

ROC AUC en los datos de desarrollo:

source         score
detox          0.821665
paraphraser    0.848287
rupaws_qqp     0.761481
rupaws_wiki    0.844093

Funcionalidades

Clasificación de texto
Transformers
PyTorch
Safetensors
bert
similaridad de oraciones
detección de paráfrasis

Casos de uso

Evaluación de la similitud semántica de oraciones en ruso