BERT Election 2020 Twitter Stance Biden (KE-MLM)

kornosk
Clasificación de texto

Pesos pre-entrenados para el modelo KE-MLM en el Modelo de Lenguaje Máscara Realzado por Conocimiento para la Detección de Posturas, NAACL 2021. Este modelo está pre-entrenado en más de 5 millones de tweets en inglés sobre la Elección Presidencial de Estados Unidos de 2020. Luego se ajusta utilizando nuestros datos etiquetados con postura para la detección de posturas hacia Joe Biden.

Como usar

Este modelo de lenguaje pre-entrenado está ajustado para la tarea de detección de posturas específicamente para Joe Biden. Por favor, vea el repositorio oficial para más detalles.

from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch
import numpy as np

# Elegir GPU si disponible
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

# Seleccione la ruta del modelo aquí
pretrained_LM_path = "kornosk/bert-election2020-twitter-stance-biden-KE-MLM"

# Cargar modelo
tokenizer = AutoTokenizer.from_pretrained(pretrained_LM_path)
model = AutoModelForSequenceClassification.from_pretrained(pretrained_LM_path)

id2label = {
  0: "AGAINST",
  1: "FAVOR",
  2: "NONE"
}

##### Predicción Neutral #####
sentence = "Hello World."
inputs = tokenizer(sentence.lower(), return_tensors="pt")
outputs = model(**inputs)
predicted_probability = torch.softmax(outputs[0], dim=1)[0].tolist()

print("Sentence:", sentence)
print("Prediction:", id2label[np.argmax(predicted_probability)])
print("Against:", predicted_probability[0])
print("Favor:", predicted_probability[1])
print("Neutral:", predicted_probability[2])

##### Predicción Favor #####
sentence = "Go Go Biden!!!"
inputs = tokenizer(sentence.lower(), return_tensors="pt")
outputs = model(**inputs)
predicted_probability = torch.softmax(outputs[0], dim=1)[0].tolist()

print("Sentence:", sentence)
print("Prediction:", id2label[np.argmax(predicted_probability)])
print("Against:", predicted_probability[0])
print("Favor:", predicted_probability[1])
print("Neutral:", predicted_probability[2])

##### Predicción Against #####
sentence = "Biden is the worst."
inputs = tokenizer(sentence.lower(), return_tensors="pt")
outputs = model(**inputs)
predicted_probability = torch.softmax(outputs[0], dim=1)[0].tolist()

print("Sentence:", sentence)
print("Prediction:", id2label[np.argmax(predicted_probability)])
print("Against:", predicted_probability[0])
print("Favor:", predicted_probability[1])
print("Neutral:", predicted_probability[2])

Por favor considere citar nuestro trabajo si le resulta útil. :)

Funcionalidades

Clasificación de texto
Transformers
Compatible con PyTorch y JAX
Detección de posturas en Twitter
Pre-entrenado en tweets de la elección de 2020 en Estados Unidos
Ajustado específicamente para detectar posturas hacia Joe Biden

Casos de uso

Detectar la postura hacia Joe Biden en tweets
Clasificación de textos relacionados con política
Análisis de sentimientos en redes sociales sobre elecciones
Estudio de opiniones sobre candidatos políticos