unicamp-dl/mMiniLM-L6-v2-pt-msmarco-v1

unicamp-dl
Clasificación de texto

mMiniLM-L6-v2-pt-msmarco-v1 es un modelo multilingüe basado en miniLM afinado en una versión traducida al portugués del conjunto de datos de pasajes MS MARCO. En la versión v1, el conjunto de datos en portugués fue traducido utilizando el modelo Helsinki NMT. Más información sobre el conjunto de datos o el método de traducción se puede encontrar en mMARCO: A Multilingual Version of MS MARCO Passage Ranking Dataset y en el repositorio de mMARCO.

Como usar

from transformers import AutoTokenizer, AutoModel

model_name = 'unicamp-dl/mMiniLM-L6-v2-pt-msmarco-v1'
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModel.from_pretrained(model_name)

Funcionalidades

Clasificación de texto
Basado en Transformers
Compatible con PyTorch
Compatible con TensorFlow
Optimizado para el conjunto de datos MS MARCO

Casos de uso

Clasificación de texto en portugués
Reranking de pasajes en búsquedas
Análisis de contenido en portugués