s-nlp/mdeberta-base-formality-ranker

s-nlp

Clasificación de texto

Este es el modelo presentado en el artículo "Detecting Text Formality: A Study of Text Classification Approaches". El modelo original es mDeBERTa (base). Luego, fue afinado en el corpus multilingüe para la clasificación de formalidad X-FORMAL que consiste en 4 idiomas: inglés (de GYAFC), francés, italiano y portugués brasileño. En nuestros experimentos, el modelo mostró los mejores resultados dentro de los modelos basados en Transformers para la tarea de clasificación de formalidad multilingüe.

Como usar

from transformers import AutoModelForSequenceClassification, AutoTokenizer
model_name = 'mdeberta-base-formality-ranker'
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)

Funcionalidades

Clasificación de texto
Transfomers
PyTorch
Safetensors
Soporte para 4 idiomas
Basado en mDeBERTa (base)
Afinado en corpus multilingüe X-FORMAL

Casos de uso

Detección de formalidad textual
Clasificación multilingüe de formalidad
Aplicaciones de procesamiento del lenguaje natural que requieran detectar niveles de formalidad