unicamp-dl/mMiniLM-L6-v2-pt-msmarco-v1
unicamp-dl
Clasificación de texto
mMiniLM-L6-v2-pt-msmarco-v1 es un modelo multilingüe basado en miniLM afinado en una versión traducida al portugués del conjunto de datos de pasajes MS MARCO. En la versión v1, el conjunto de datos en portugués fue traducido utilizando el modelo Helsinki NMT. Más información sobre el conjunto de datos o el método de traducción se puede encontrar en mMARCO: A Multilingual Version of MS MARCO Passage Ranking Dataset y en el repositorio de mMARCO.
Como usar
from transformers import AutoTokenizer, AutoModel
model_name = 'unicamp-dl/mMiniLM-L6-v2-pt-msmarco-v1'
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModel.from_pretrained(model_name)
Funcionalidades
- Clasificación de texto
- Basado en Transformers
- Compatible con PyTorch
- Compatible con TensorFlow
- Optimizado para el conjunto de datos MS MARCO
Casos de uso
- Clasificación de texto en portugués
- Reranking de pasajes en búsquedas
- Análisis de contenido en portugués