german-sentiment-bert

oliverguhr
Clasificación de texto

Este modelo fue entrenado para la clasificación de sentimientos de textos en alemán. Para lograr los mejores resultados, todas las entradas del modelo deben ser preprocesadas con el mismo procedimiento que se aplicó durante el entrenamiento. Para simplificar el uso del modelo, proporcionamos un paquete de Python que agrupa el código necesario para el preprocesamiento y la inferencia. El modelo utiliza la arquitectura Bert de Google y se entrenó con 1.834 millones de muestras en alemán. Los datos de entrenamiento contienen textos de varios dominios como Twitter, Facebook y reseñas de películas, aplicaciones y hoteles. Puede encontrar más información sobre el conjunto de datos y el proceso de entrenamiento en el artículo.

Como usar

Para comenzar, instale el paquete desde pypi:

pip install germansentiment
from germansentiment import SentimentModel

model = SentimentModel()

texts = [
"Mit keinem guten Ergebniss","Das ist gar nicht mal so gut",
"Total awesome!","nicht so schlecht wie erwartet",
"Der Test verlief positiv.","Sie fährt ein grünes Auto."]

result = model.predict_sentiment(texts)
print(result)

El código anterior producirá la siguiente lista:

["negative","negative","positive","positive","neutral", "neutral"]

Para obtener las probabilidades de las clases:

from germansentiment import SentimentModel

model = SentimentModel()

classes, probabilities = model.predict_sentiment(["das ist super"], output_probabilities=True)
print(classes, probabilities)
['positive'] [[['positive', 0.9761366844177246], ['negative', 0.023540444672107697], ['neutral', 0.00032294404809363186]]]

Funcionalidades

Clasificación de sentimientos de textos en alemán
Arquitectura Bert de Google
Entrenado con 1.834 millones de muestras en alemán

Casos de uso

Análisis de sentimientos en redes sociales (Twitter, Facebook)
Evaluación de reseñas de películas, aplicaciones y hoteles