naija-twitter-sentiment-afriberta-large

Davlan

Clasificación de texto

naija-twitter-sentiment-afriberta-large es el primer modelo multilingüe de clasificación de sentimientos en Twitter para cuatro (4) idiomas nigerianos (Hausa, Igbo, Pidgin Nigeriano y Yorùbá) basado en un modelo grande ajustado de castorini/afriberta_large. Logra el rendimiento de última generación para la tarea de clasificación de sentimientos en Twitter entrenado con el corpus NaijaSenti. El modelo ha sido entrenado para clasificar tweets en 3 clases de sentimientos: negativo, neutral y positivo. Específicamente, este modelo es un xlm-roberta-large que se ajustó con una agregación de 4 conjuntos de datos de idiomas nigerianos obtenidos del conjunto de datos NaijaSenti.

Como usar

Puedes usar este modelo con Transformers para Clasificación de Sentimientos.
from transformers import AutoModelForSequenceClassification
from transformers import AutoTokenizer
import numpy as np
from scipy.special import softmax

MODEL = "Davlan/naija-twitter-sentiment-afriberta-large"
tokenizer = AutoTokenizer.from_pretrained(MODEL)

# PT
model = AutoModelForSequenceClassification.from_pretrained(MODEL)

text = "I like you"
encoded_input = tokenizer(text, return_tensors='pt')
output = model(**encoded_input)
scores = output[0][0].detach().numpy()
scores = softmax(scores)

id2label = {0:"positive", 1:"neutral", 2:"negative"}

ranking = np.argsort(scores)
ranking = ranking[::-1]
for i in range(scores.shape[0]):
    l = id2label[ranking[i]]
    s = scores[ranking[i]]
    print(f"{i+1}) {l} {np.round(float(s), 4)}")

Funcionalidades

Clasificación de sentimientos en Twitter
Multilingüe: Hausa, Igbo, Pidgin Nigeriano, Yorùbá
Modelo xlm-roberta-large ajustado
Clases de sentimiento: negativo, neutral, positivo

Casos de uso

Clasificación de sentimientos en Twitter