german-sentiment-bert
Este modelo fue entrenado para la clasificación de sentimientos de textos en alemán. Para lograr los mejores resultados, todas las entradas del modelo deben ser preprocesadas con el mismo procedimiento que se aplicó durante el entrenamiento. Para simplificar el uso del modelo, proporcionamos un paquete de Python que agrupa el código necesario para el preprocesamiento y la inferencia. El modelo utiliza la arquitectura Bert de Google y se entrenó con 1.834 millones de muestras en alemán. Los datos de entrenamiento contienen textos de varios dominios como Twitter, Facebook y reseñas de películas, aplicaciones y hoteles. Puede encontrar más información sobre el conjunto de datos y el proceso de entrenamiento en el artículo.
Como usar
Para comenzar, instale el paquete desde pypi:
pip install germansentiment
from germansentiment import SentimentModel
model = SentimentModel()
texts = [
"Mit keinem guten Ergebniss","Das ist gar nicht mal so gut",
"Total awesome!","nicht so schlecht wie erwartet",
"Der Test verlief positiv.","Sie fährt ein grünes Auto."]
result = model.predict_sentiment(texts)
print(result)
El código anterior producirá la siguiente lista:
["negative","negative","positive","positive","neutral", "neutral"]
Para obtener las probabilidades de las clases:
from germansentiment import SentimentModel
model = SentimentModel()
classes, probabilities = model.predict_sentiment(["das ist super"], output_probabilities=True)
print(classes, probabilities)
['positive'] [[['positive', 0.9761366844177246], ['negative', 0.023540444672107697], ['neutral', 0.00032294404809363186]]]
Funcionalidades
- Clasificación de sentimientos de textos en alemán
- Arquitectura Bert de Google
- Entrenado con 1.834 millones de muestras en alemán
Casos de uso
- Análisis de sentimientos en redes sociales (Twitter, Facebook)
- Evaluación de reseñas de películas, aplicaciones y hoteles