distilbert-tweets-políticos
m-newhauser
Clasificación de texto
Este modelo es una versión ajustada de distilbert-base-uncased en el conjunto de datos m-newhauser/senator-tweets, que contiene todos los tweets hechos por los senadores de los Estados Unidos durante el primer año de la Administración Biden. El modelo tiene como objetivo clasificar piezas cortas de texto como sentimentales hacia el Partido Demócrata o Republicano. Fue ajustado con 99,693 tweets (51.6% Demócrata, 48.4% Republicano) realizados por senadores de EE.UU. en 2021. La precisión del modelo puede no mantenerse en textos más largos que un tweet. Los resultados alcanzados en el conjunto de evaluación son: Precisión: 0.9076, F1: 0.9117.
Como usar
Los siguientes hiperparámetros fueron utilizados durante el entrenamiento:
- optimizador: Adam
- precision_entrenamiento: float32
- tasa_de_aprendizaje: 5e-5
- num_epochs: 5
Versiones del Marco:
- Transformadores 4.16.2
- TensorFlow 2.8.0
- Datasets 1.18.3
- Tokenizers 0.11.6
Funcionalidades
- Clasificación de texto
- Transformadores
- PyTorch
- TensorFlow
Casos de uso
- Clasificación de sentimientos políticos en tweets
- Análisis de sentimiento de textos cortos políticos