5CD-AI/Vietnamese-Sentiment-visobert

5CD-AI
Clasificación de texto

Este modelo está basado en nuestro modelo preentrenado 5CD-AI/visobert-14gb-corpus, el cual ha sido entrenado continuamente en un conjunto de datos de 14GB de contenido social vietnamita. Este modelo puede manejar bien muchos sentimientos en comentarios acompañados de emojis 😂👍💬🔥. Nuestro modelo está ajustado en 120K conjuntos de datos de análisis de sentimientos vietnamitas, incluyendo comentarios y reseñas de plataformas de comercio electrónico, redes sociales y foros. Nuestro modelo ha sido entrenado en una variedad de conjuntos de datos diversos: SA-VLSP2016, AIVIVN-2019, UIT-VSFC, UIT-VSMEC, UIT-ViCTSD, UIT-ViOCD, UIT-ViSFD, Vi-amazon-reviews, Tiki-reviews. El modelo proporciona salidas softmax para tres etiquetas.

Como usar

Uso (Transformers de HuggingFace)

pip install transformers
from transformers import pipeline
model_path = '5CD-AI/Vietnamese-Sentiment-visobert'
sentiment_task = pipeline("sentiment-analysis", model=model_path, tokenizer=model_path)
sentiment_task("Miếng dán dễ xước , ko khít với dt 11 prm")

Salida:

[{'label': 'NEG', 'score': 0.998149037361145}]

Otros ejemplos:

Sentence:  Đây là mô hình rất hay, đáp ứng tốt nhu cầu của nhiều doanh nghiệp Việt.
### Sentiment score ####
1) POS: 0.9995
2) NEG: 0.0003
3) NEU: 0.0003

Sentence:  Qua vụ này thì uy tín của Trump càng lớn hơn nữa. Nhất là với hình ảnh đầy tính biểu tượng như trên.
### Sentiment score ####
1) POS: 0.9965
2) NEG: 0.0029
3) NEU: 0.0005

 Sentence:  Bãi đi nó lừa lắm, mình có bỏ vào ví tt này hơn 20 triệu. Lãi tính ra cả tháng dc bao nhiêu mình không nhớ, nhưng khi rút về ngân hàng nó trừ phí giao dịch hơn mịa nó tiền lãi.
Nên từ đó cạch luôn.
### Sentiment score ####
1) NEG: 0.999
2) POS: 0.0008
3) NEU: 0.0002

 Sentence:  Vậy chắc tùy nơi rồi :D
Chỗ mình chuộng hàng masan lắm, mì gói thì không hẳn (có kokomi cũng bán chạy), con gia vị thì gần như toàn đồ masan.
### Sentiment score ####
1) NEU: 0.9824
2) NEG: 0.0157
3) POS: 0.0019

Clasificación completa:

from transformers import AutoModelForSequenceClassification
from transformers import TFAutoModelForSequenceClassification
from transformers import AutoTokenizer, AutoConfig
import numpy as np
import torch

#### Cargar modelo
model_path = '5CD-AI/Vietnamese-Sentiment-visobert'
tokenizer = AutoTokenizer.from_pretrained(model_path)
config = AutoConfig.from_pretrained(model_path)
model = AutoModelForSequenceClassification.from_pretrained(model_path).to("cuda")

sentence = 'Cũng giống mấy khoá Youtube học cũng được'
print('Sentence: ', sentence)

input_ids = torch.tensor([tokenizer.encode(sentence)]).to("cuda")

with torch.no_grad():
    out = model(input_ids)
    scores = out.logits.softmax(dim=-1).cpu().numpy()[0]

# Imprimir etiquetas y puntajes
ranking = np.argsort(scores)
ranking = ranking[::-1]
print("### Sentiment score ####")
for i in range(scores.shape[0]):
    l = config.id2label[ranking[i]]
    s = scores[ranking[i]]
    print(f"{i+1}) {l}: {np.round(float(s), 4)}")

Funcionalidades

Clasificación de texto
Transformers
Compatibilidad con AutoTrain
Compatibilidad con Inference Endpoints

Casos de uso

Análisis de sentimientos en comentarios de redes sociales
Monitoreo de opiniones en plataformas de comercio electrónico
Clasificación de reseñas en foros

Recibe las últimas noticias y actualizaciones sobre el mundo de IA directamente en tu bandeja de entrada.