protectai/xlm-roberta-base-language-detection-onnx

protectai

Clasificación de texto

Este modelo es una conversión de papluca/xlm-roberta-base-language-detection al formato ONNX utilizando la librería 🤗 Optimum. Es una versión ajustada del modelo xlm-roberta-base en el conjunto de datos de Identificación de Lenguaje. Este modelo es un transformador XLM-RoBERTa con una cabeza de clasificación en la parte superior (es decir, una capa lineal en la salida agrupada). Para información adicional, por favor, consulte la tarjeta del modelo xlm-roberta-base o el artículo 'Unsupervised Cross-lingual Representation Learning at Scale' por Conneau et al.

Como usar

from optimum.onnxruntime import ORTModelForSequenceClassification
from transformers import AutoTokenizer, pipeline

tokenizer = AutoTokenizer.from_pretrained("laiyer/xlm-roberta-base-language-detection-onnx")
model = ORTModelForSequenceClassification.from_pretrained("laiyer/xlm-roberta-base-language-detection-onnx")
classifier = pipeline(
    task="text-classification",
    model=model,
    tokenizer=tokenizer,
    top_k=None,
)

classifier_output = classifier("It's not toxic comment")
print(classifier_output)

Funcionalidades

Conversión a formato ONNX
Ajustado en el conjunto de datos de Identificación de Lenguaje
Modelo de transformador XLM-RoBERTa
Cabeza de clasificación en la parte superior
Requiere la librería 🤗 Optimum

Casos de uso

Detector de idioma, es decir, para tareas de clasificación de secuencias