naija-twitter-sentiment-afriberta-large
naija-twitter-sentiment-afriberta-large es el primer modelo multilingüe de clasificación de sentimientos en Twitter para cuatro (4) idiomas nigerianos (Hausa, Igbo, Pidgin Nigeriano y Yorùbá) basado en un modelo grande ajustado de castorini/afriberta_large. Logra el rendimiento de última generación para la tarea de clasificación de sentimientos en Twitter entrenado con el corpus NaijaSenti. El modelo ha sido entrenado para clasificar tweets en 3 clases de sentimientos: negativo, neutral y positivo. Específicamente, este modelo es un xlm-roberta-large que se ajustó con una agregación de 4 conjuntos de datos de idiomas nigerianos obtenidos del conjunto de datos NaijaSenti.
Como usar
Puedes usar este modelo con Transformers para Clasificación de Sentimientos.
from transformers import AutoModelForSequenceClassification
from transformers import AutoTokenizer
import numpy as np
from scipy.special import softmax
MODEL = "Davlan/naija-twitter-sentiment-afriberta-large"
tokenizer = AutoTokenizer.from_pretrained(MODEL)
# PT
model = AutoModelForSequenceClassification.from_pretrained(MODEL)
text = "I like you"
encoded_input = tokenizer(text, return_tensors='pt')
output = model(**encoded_input)
scores = output[0][0].detach().numpy()
scores = softmax(scores)
id2label = {0:"positive", 1:"neutral", 2:"negative"}
ranking = np.argsort(scores)
ranking = ranking[::-1]
for i in range(scores.shape[0]):
l = id2label[ranking[i]]
s = scores[ranking[i]]
print(f"{i+1}) {l} {np.round(float(s), 4)}")
Funcionalidades
- Clasificación de sentimientos en Twitter
- Multilingüe: Hausa, Igbo, Pidgin Nigeriano, Yorùbá
- Modelo xlm-roberta-large ajustado
- Clases de sentimiento: negativo, neutral, positivo
Casos de uso
- Clasificación de sentimientos en Twitter