s-nlp/mdeberta-base-formality-ranker
s-nlp
Clasificación de texto
Este es el modelo presentado en el artículo "Detecting Text Formality: A Study of Text Classification Approaches". El modelo original es mDeBERTa (base). Luego, fue afinado en el corpus multilingüe para la clasificación de formalidad X-FORMAL que consiste en 4 idiomas: inglés (de GYAFC), francés, italiano y portugués brasileño. En nuestros experimentos, el modelo mostró los mejores resultados dentro de los modelos basados en Transformers para la tarea de clasificación de formalidad multilingüe.
Como usar
from transformers import AutoModelForSequenceClassification, AutoTokenizer
model_name = 'mdeberta-base-formality-ranker'
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)
Funcionalidades
- Clasificación de texto
- Transfomers
- PyTorch
- Safetensors
- Soporte para 4 idiomas
- Basado en mDeBERTa (base)
- Afinado en corpus multilingüe X-FORMAL
Casos de uso
- Detección de formalidad textual
- Clasificación multilingüe de formalidad
- Aplicaciones de procesamiento del lenguaje natural que requieran detectar niveles de formalidad