clasificador_de_formalidad_xlmr_de_s-nlp

s-nlp
Clasificación de texto

Clasificador basado en XLM-Roberta entrenado en XFORMAL. Este modelo utiliza técnicas avanzadas de inteligencia artificial y aprendizaje profundo para determinar el nivel de formalidad en diversos textos. Es compatible con la biblioteca de transformadores y se puede utilizar con PyTorch. El clasificador es compatible con múltiples idiomas y ha sido ajustado para una variedad de tareas de clasificación de texto.

Como usar

Cómo usar

from transformers import XLMRobertaTokenizerFast, XLMRobertaForSequenceClassification

# cargar el tokenizador y los pesos del modelo
tokenizer = XLMRobertaTokenizerFast.from_pretrained('s-nlp/xlmr_formality_classifier')
model = XLMRobertaForSequenceClassification.from_pretrained('s-nlp/xlmr_formality_classifier')

id2formality = {0: 'formal', 1: 'informal'}
texts = [
"Me gustas. Te quiero.",
"Hey, ¿qué pasa?",
"Siema, ¿qué haces?",
"Siento un profundo pesar y tristeza por la situación en la política internacional.",
]

# preparar la entrada
encoding = tokenizer(
texts,
add_special_tokens=True,
return_token_type_ids=True,
truncation=True,
padding='max_length',
return_tensors='pt',
)

# inferencia
output = model(**encoding)

formality_scores = [
{id2formality[idx]: score for idx, score in enumerate(text_scores.tolist())}
for text_scores in output.logits.softmax(dim=1)
]
formality_scores

Funcionalidades

Clasificación de texto
Automóvil de transformadores
Compatibilidad con AutoTokenizer
Precisión ponderada alta
Compatibilidad con AutoTrain
Endpoints de inferencia
Basado en XLM-Roberta
Manejo de tensores seguros (Safetensors)
Uso compatible con PyTorch

Casos de uso

Detectar el nivel de formalidad en correos electrónicos.
Clasificar textos en redes sociales según su formalidad.
Ayudar en el análisis de documentos legales y su formalidad.
Mejorar los sistemas de corrección y edición de textos según su género.