xlm-v-base-language-id

juliensimon

Clasificación de texto

Este modelo es una versión afinada del facebook/xlm-v-base en el conjunto de datos google/fleurs. Logra los siguientes resultados en el conjunto de evaluación: Pérdida: 0.0241 Precisión: 0.9930

Como usar

La forma más sencilla de usar el modelo es con una tubería de clasificación de texto:
from transformers import pipeline

model_id = "juliensimon/xlm-v-base-language-id"
p = pipeline("text-classification", model=model_id)
p("Hello world")
# [{'label': 'English', 'score': 0.9802148342132568}]

El modelo también es compatible con Optimum Intel. Por ejemplo, puedes optimizarlo con Intel OpenVINO y disfrutar de un aumento de velocidad de inferencia de 2x (o más):
from optimum.intel.openvino import OVModelForSequenceClassification
from transformers import AutoTokenizer, pipeline

model_id = "juliensimon/xlm-v-base-language-id"
ov_model = OVModelForSequenceClassification.from_pretrained(model_id)
tokenizer = AutoTokenizer.from_pretrained(model_id)
p = pipeline("text-classification", model=ov_model, tokenizer=tokenizer)
p("Hello world")
# [{'label': 'English', 'score': 0.9802149534225464}]

Una versión OpenVINO del modelo está disponible en el repositorio.

Funcionalidades

Clasificación de texto
Detección de 102 idiomas
Compatible con Optimum Intel y OpenVINO para aumento de velocidad de inferencia

Casos de uso

Identificación del idioma en textos
Clasificación de textos en múltiples idiomas
Optimización para inferencia rápida en dispositivos con Intel