distilbert-tweets-políticos

m-newhauser
Clasificación de texto

Este modelo es una versión ajustada de distilbert-base-uncased en el conjunto de datos m-newhauser/senator-tweets, que contiene todos los tweets hechos por los senadores de los Estados Unidos durante el primer año de la Administración Biden. El modelo tiene como objetivo clasificar piezas cortas de texto como sentimentales hacia el Partido Demócrata o Republicano. Fue ajustado con 99,693 tweets (51.6% Demócrata, 48.4% Republicano) realizados por senadores de EE.UU. en 2021. La precisión del modelo puede no mantenerse en textos más largos que un tweet. Los resultados alcanzados en el conjunto de evaluación son: Precisión: 0.9076, F1: 0.9117.

Como usar

Los siguientes hiperparámetros fueron utilizados durante el entrenamiento:

  • optimizador: Adam
  • precision_entrenamiento: float32
  • tasa_de_aprendizaje: 5e-5
  • num_epochs: 5

Versiones del Marco:

  • Transformadores 4.16.2
  • TensorFlow 2.8.0
  • Datasets 1.18.3
  • Tokenizers 0.11.6

Funcionalidades

Clasificación de texto
Transformadores
PyTorch
TensorFlow

Casos de uso

Clasificación de sentimientos políticos en tweets
Análisis de sentimiento de textos cortos políticos