VietnamLegalText-SBERT
hmthanh
Clasificación de texto
VietnamLegalText-SBERT es un modelo de BERT optimizado para la clasificación de texto legal en vietnamita. Este modelo fue creado por el usuario hmthanh el 28 de diciembre de 2022 y ha sido descargado 1051 veces hasta ahora. Utiliza la biblioteca Transformers y está basado en el modelo RoBERTa. Con 135 millones de parámetros, es adecuado para tareas de clasificación de texto y puede procesar textos con una longitud máxima de 256 tokens.
Como usar
import torch
from transformers import AutoModel, AutoTokenizer
phobert = AutoModel.from_pretrained("hmthanh/VietnamLegalText-SBERT")
tokenizer = AutoTokenizer.from_pretrained("hmthanh/VietnamLegalText-SBERT")
sentence = 'Vượt đèn đỏ bị phạt bao nhiêu tiền?'
input_ids = torch.tensor([tokenizer.encode(sentence)])
with torch.no_grad():
features = phobert(input_ids) # Models outputs are now tuples
Funcionalidades
- Clasificación de texto
- Basado en Transformers
- Optimizado para texto legal en vietnamita
- Compatible con AutoTrain
- Compatible con Endpoints de Inferencia
- Licencia MIT
Casos de uso
- Clasificación de documentos legales
- Análisis de sentencias legales
- Filtrado de textos legales