T-XLM-RoBERTa-Hindi-Sentiment

LondonStory

Clasificación de texto

El modelo T-XLM-RoBERTa-Hindi-Sentiment es una versión ajustada del modelo Twitter-XLM-RoBERTa-base de Cardiff-NLP. Es un clasificador de sentimientos en idioma hindi (en escritura Devanagari) que ha sido entrenado con un conjunto de datos disponible públicamente en hindi. El conjunto de datos de entrenamiento consta de 6807 ejemplos etiquetados en hindi, mientras que el conjunto de prueba y validación consisten en 1634 y 635 ejemplos etiquetados respectivamente. El modelo entrenado muestra una puntuación F1 media ponderada de 0.89 (ver la matriz de confusión en el cuaderno de Google Colab a continuación).

Como usar

El cuaderno de Google Colab, donde el modelo se ajusta utilizando módulos nativos de PyTorch, se puede encontrar en la página de GitHub de LondonStory AQUÍ.

Funcionalidades

Clasificación de sentimientos en idioma hindi
Trabaja con escritura Devanagari
Entrenado con un conjunto de datos público en hindi
Puntuación F1 media ponderada de 0.89
Compatible con AutoTrain y Endpoints de inferencia

Casos de uso

Clasificación automática de sentimientos en publicaciones en hindi
Análisis de sentimientos para redes sociales en idioma hindi
Investigación de contenido en idioma hindi
Monitoreo de la opinión pública en hindi