clampert/multilingual-sentiment-covid19
clampert
Clasificación de texto
Predicción de sentimientos multilingüe entrenada a partir de tweets relacionados con COVID19. Modelo entrenado en un gran conjunto de datos (18437530 ejemplos) de tweets multilingües recopilados entre marzo de 2020 y noviembre de 2021 utilizando la API de transmisión de Twitter con varias palabras clave relacionadas con COVID19. Las etiquetas se generaron automáticamente en función de la presencia de emoticonos positivos y negativos. Para obtener detalles sobre el conjunto de datos, consulte nuestra publicación de IEEE BigData 2021. El modelo base es sentence-transformers/stsb-xlm-r-multilingual. Fue afinado para la clasificación de secuencias con etiquetas positivas y negativas durante dos épocas (48 horas en 8xP100 GPUs).
Como usar
from transformers import AutoTokenizer, AutoModelForSequenceClassification
tokenizer = AutoTokenizer.from_pretrained('clampert/multilingual-sentiment-covid19')
model = AutoModelForSequenceClassification.from_pretrained('clampert/multilingual-sentiment-covid19')
inputs = tokenizer("I am very happy.", return_tensors="pt")
outputs = model(**inputs)
Funcionalidades
- Clasificación de texto
- Transformers
- PyTorch
- Multilingüe
- XLM-Roberta
- Análisis de sentimiento
- Compatible con AutoTrain
- Compatible con Puntos Finales de Inferencia
- Licencia: Apache 2.0
- Región: EE. UU.
Casos de uso
- Análisis de sentimiento en múltiples idiomas a partir de tweets relacionados con COVID19.
- Investigación sobre la discriminación de lenguas raras en el análisis de sentimientos multilingüe.