xlm-v-base-language-id
juliensimon
Clasificación de texto
Este modelo es una versión afinada del facebook/xlm-v-base en el conjunto de datos google/fleurs. Logra los siguientes resultados en el conjunto de evaluación: Pérdida: 0.0241 Precisión: 0.9930
Como usar
La forma más sencilla de usar el modelo es con una tubería de clasificación de texto:
from transformers import pipeline
model_id = "juliensimon/xlm-v-base-language-id"
p = pipeline("text-classification", model=model_id)
p("Hello world")
# [{'label': 'English', 'score': 0.9802148342132568}]
El modelo también es compatible con Optimum Intel. Por ejemplo, puedes optimizarlo con Intel OpenVINO y disfrutar de un aumento de velocidad de inferencia de 2x (o más):
from optimum.intel.openvino import OVModelForSequenceClassification
from transformers import AutoTokenizer, pipeline
model_id = "juliensimon/xlm-v-base-language-id"
ov_model = OVModelForSequenceClassification.from_pretrained(model_id)
tokenizer = AutoTokenizer.from_pretrained(model_id)
p = pipeline("text-classification", model=ov_model, tokenizer=tokenizer)
p("Hello world")
# [{'label': 'English', 'score': 0.9802149534225464}]
Una versión OpenVINO del modelo está disponible en el repositorio.
Funcionalidades
- Clasificación de texto
- Detección de 102 idiomas
- Compatible con Optimum Intel y OpenVINO para aumento de velocidad de inferencia
Casos de uso
- Identificación del idioma en textos
- Clasificación de textos en múltiples idiomas
- Optimización para inferencia rápida en dispositivos con Intel