rubert-base-cased-sentiment

blanchefort
Clasificación de texto

Clasificación de sentimientos en textos cortos rusos. Este es un modelo DeepPavlov/rubert-base-cased-conversational entrenado en un corpus agregado de 351.797 textos.

Como usar

import torch
from transformers import AutoModelForSequenceClassification
from transformers import BertTokenizerFast

tokenizer = BertTokenizerFast.from_pretrained('blanchefort/rubert-base-cased-sentiment')
model = AutoModelForSequenceClassification.from_pretrained('blanchefort/rubert-base-cased-sentiment', return_dict=True)

@torch.no_grad()
def predict(text):
  inputs = tokenizer(text, max_length=512, padding=True, truncation=True, return_tensors='pt')
  outputs = model(**inputs)
  predicted = torch.nn.functional.softmax(outputs.logits, dim=1)
  predicted = torch.argmax(predicted, dim=1).numpy()
  return predicted

Funcionalidades

Clasificación de textos cortos en ruso
Entrenado en corpus de 351.797 textos
Modelo basado en DeepPavlov rubert-base-cased-conversational

Casos de uso

Clasificación de sentimientos en publicaciones de microblogs
Análisis de reseñas de productos
Opiniones de usuarios sobre instituciones médicas