clasificador_de_formalidad_xlmr_de_s-nlp
s-nlp
Clasificación de texto
Clasificador basado en XLM-Roberta entrenado en XFORMAL. Este modelo utiliza técnicas avanzadas de inteligencia artificial y aprendizaje profundo para determinar el nivel de formalidad en diversos textos. Es compatible con la biblioteca de transformadores y se puede utilizar con PyTorch. El clasificador es compatible con múltiples idiomas y ha sido ajustado para una variedad de tareas de clasificación de texto.
Como usar
Cómo usar
from transformers import XLMRobertaTokenizerFast, XLMRobertaForSequenceClassification
# cargar el tokenizador y los pesos del modelo
tokenizer = XLMRobertaTokenizerFast.from_pretrained('s-nlp/xlmr_formality_classifier')
model = XLMRobertaForSequenceClassification.from_pretrained('s-nlp/xlmr_formality_classifier')
id2formality = {0: 'formal', 1: 'informal'}
texts = [
"Me gustas. Te quiero.",
"Hey, ¿qué pasa?",
"Siema, ¿qué haces?",
"Siento un profundo pesar y tristeza por la situación en la política internacional.",
]
# preparar la entrada
encoding = tokenizer(
texts,
add_special_tokens=True,
return_token_type_ids=True,
truncation=True,
padding='max_length',
return_tensors='pt',
)
# inferencia
output = model(**encoding)
formality_scores = [
{id2formality[idx]: score for idx, score in enumerate(text_scores.tolist())}
for text_scores in output.logits.softmax(dim=1)
]
formality_scores
Funcionalidades
- Clasificación de texto
- Automóvil de transformadores
- Compatibilidad con AutoTokenizer
- Precisión ponderada alta
- Compatibilidad con AutoTrain
- Endpoints de inferencia
- Basado en XLM-Roberta
- Manejo de tensores seguros (Safetensors)
- Uso compatible con PyTorch
Casos de uso
- Detectar el nivel de formalidad en correos electrónicos.
- Clasificar textos en redes sociales según su formalidad.
- Ayudar en el análisis de documentos legales y su formalidad.
- Mejorar los sistemas de corrección y edición de textos según su género.