T-XLM-RoBERTa-Hindi-Sentiment
El modelo T-XLM-RoBERTa-Hindi-Sentiment es una versión ajustada del modelo Twitter-XLM-RoBERTa-base de Cardiff-NLP. Es un clasificador de sentimientos en idioma hindi (en escritura Devanagari) que ha sido entrenado con un conjunto de datos disponible públicamente en hindi. El conjunto de datos de entrenamiento consta de 6807 ejemplos etiquetados en hindi, mientras que el conjunto de prueba y validación consisten en 1634 y 635 ejemplos etiquetados respectivamente. El modelo entrenado muestra una puntuación F1 media ponderada de 0.89 (ver la matriz de confusión en el cuaderno de Google Colab a continuación).
Como usar
El cuaderno de Google Colab, donde el modelo se ajusta utilizando módulos nativos de PyTorch, se puede encontrar en la página de GitHub de LondonStory AQUÍ.
Funcionalidades
- Clasificación de sentimientos en idioma hindi
- Trabaja con escritura Devanagari
- Entrenado con un conjunto de datos público en hindi
- Puntuación F1 media ponderada de 0.89
- Compatible con AutoTrain y Endpoints de inferencia
Casos de uso
- Clasificación automática de sentimientos en publicaciones en hindi
- Análisis de sentimientos para redes sociales en idioma hindi
- Investigación de contenido en idioma hindi
- Monitoreo de la opinión pública en hindi