clampert/multilingual-sentiment-covid19

clampert

Clasificación de texto

Predicción de sentimientos multilingüe entrenada a partir de tweets relacionados con COVID19. Modelo entrenado en un gran conjunto de datos (18437530 ejemplos) de tweets multilingües recopilados entre marzo de 2020 y noviembre de 2021 utilizando la API de transmisión de Twitter con varias palabras clave relacionadas con COVID19. Las etiquetas se generaron automáticamente en función de la presencia de emoticonos positivos y negativos. Para obtener detalles sobre el conjunto de datos, consulte nuestra publicación de IEEE BigData 2021. El modelo base es sentence-transformers/stsb-xlm-r-multilingual. Fue afinado para la clasificación de secuencias con etiquetas positivas y negativas durante dos épocas (48 horas en 8xP100 GPUs).

Como usar

from transformers import AutoTokenizer, AutoModelForSequenceClassification

tokenizer = AutoTokenizer.from_pretrained('clampert/multilingual-sentiment-covid19')
model = AutoModelForSequenceClassification.from_pretrained('clampert/multilingual-sentiment-covid19')

inputs = tokenizer("I am very happy.", return_tensors="pt")
outputs = model(**inputs)

Funcionalidades

Clasificación de texto
Transformers
PyTorch
Multilingüe
XLM-Roberta
Análisis de sentimiento
Compatible con AutoTrain
Compatible con Puntos Finales de Inferencia
Licencia: Apache 2.0
Región: EE. UU.

Casos de uso

Análisis de sentimiento en múltiples idiomas a partir de tweets relacionados con COVID19.
Investigación sobre la discriminación de lenguas raras en el análisis de sentimientos multilingüe.