bert-base-turkish-sentiment-cased
savasy
Clasificación de texto
Este modelo se utiliza para el Análisis de Sentimientos, basado en BERTurk para el idioma turco. El modelo puede clasificar el sentimiento de textos turcos como positivo o negativo.
Como usar
from transformers import AutoModelForSequenceClassification, AutoTokenizer, pipeline
model = AutoModelForSequenceClassification.from_pretrained("savasy/bert-base-turkish-sentiment-cased")
tokenizer = AutoTokenizer.from_pretrained("savasy/bert-base-turkish-sentiment-cased")
sa = pipeline("sentiment-analysis", tokenizer=tokenizer, model=model)
p = sa("bu telefon modelleri çok kaliteli , her parçası çok özel bence")
print(p)
# [{'label': 'LABEL_1', 'score': 0.9871089}]
print(p[0]['label'] == 'LABEL_1')
# True
p = sa("Film çok kötü ve çok sahteydi")
print(p)
# [{'label': 'LABEL_0', 'score': 0.9975505}]
print(p[0]['label'] == 'LABEL_1')
# False
input_file = "/path/to/your/file/yourfile.tsv"
i, crr = 0, 0
for line in open(input_file):
lines = line.strip().split(" ")
if len(lines) == 2:
i = i + 1
if i%100 == 0:
print(i)
pred = sa(lines[0])
pred = pred[0]["label"].split("_")[1]
if pred == lines[1]:
crr = crr + 1
print(crr, i, crr/i)
Funcionalidades
- Clasificación de textos
- Basado en BERTurk
- Compatible con Transformers
- Soporte para PyTorch y JAX
- Tamaño del modelo: 111M parámetros
- Tipo de tensor: F32
- Disponible en formato Safetensors
Casos de uso
- Análisis de sentimientos en turco
- Clasificación de reseñas de productos
- Clasificación de reseñas de películas
- Clasificación de tweets en turco