rubert-base-cased-conversational-paraphrase-v1
s-nlp
Clasificación de texto
Este es un modelo ruBERT-conversacional entrenado en una mezcla de 3 conjuntos de datos de detección de paráfrasis: - ru_paraphraser (con las clases -1 y 0 combinadas) - RuPAWS - Un conjunto de datos que contiene una evaluación mediante crowdsourcing de la preservación del contenido en la desintoxicación de texto ruso por Dementieva et al, 2022. El modelo puede usarse para evaluar la similitud semántica de oraciones en ruso. Consulte también la documentación de SkolkovoInstitute/ruRoberta-large-paraphrase-v1 que tiene un mejor desempeño en esta tarea.
Como usar
Parámetros de entrenamiento:
optimizer: Adam
lr=1e-5
batch_size=32
epochs=3
ROC AUC en los datos de desarrollo:
source score
detox 0.821665
paraphraser 0.848287
rupaws_qqp 0.761481
rupaws_wiki 0.844093
Funcionalidades
- Clasificación de texto
- Transformers
- PyTorch
- Safetensors
- bert
- similaridad de oraciones
- detección de paráfrasis
Casos de uso
- Evaluación de la similitud semántica de oraciones en ruso