VietnamLegalText-SBERT

hmthanh
Clasificación de texto

VietnamLegalText-SBERT es un modelo de BERT optimizado para la clasificación de texto legal en vietnamita. Este modelo fue creado por el usuario hmthanh el 28 de diciembre de 2022 y ha sido descargado 1051 veces hasta ahora. Utiliza la biblioteca Transformers y está basado en el modelo RoBERTa. Con 135 millones de parámetros, es adecuado para tareas de clasificación de texto y puede procesar textos con una longitud máxima de 256 tokens.

Como usar

import torch
from transformers import AutoModel, AutoTokenizer

phobert = AutoModel.from_pretrained("hmthanh/VietnamLegalText-SBERT")
tokenizer = AutoTokenizer.from_pretrained("hmthanh/VietnamLegalText-SBERT")

sentence = 'Vượt đèn đỏ bị phạt bao nhiêu tiền?'

input_ids = torch.tensor([tokenizer.encode(sentence)])

with torch.no_grad():
    features = phobert(input_ids) # Models outputs are now tuples

Funcionalidades

Clasificación de texto
Basado en Transformers
Optimizado para texto legal en vietnamita
Compatible con AutoTrain
Compatible con Endpoints de Inferencia
Licencia MIT

Casos de uso

Clasificación de documentos legales
Análisis de sentencias legales
Filtrado de textos legales