use-cmlm-multilingual

sentence-transformers

Similitud de oraciones

Esta es una versión de PyTorch del modelo universal-sentence-encoder-cmlm/multilingual-base-br. Puede usarse para mapear 109 idiomas a un espacio vectorial compartido. Como el modelo se basa en LaBSE, su desempeño es bastante comparable en tareas posteriores.

Como usar

Usar este modelo se vuelve fácil cuando tienes instalado sentence-transformers:
pip install -U sentence-transformers

Luego, puedes usar el modelo así:
from sentence_transformers import SentenceTransformer
sentences = ["This is an example sentence", "Each sentence is converted"]
model = SentenceTransformer('sentence-transformers/use-cmlm-multilingual')
embeddings = model.encode(sentences)
print(embeddings)

Funcionalidades

Mapeo de 109 idiomas a un espacio vectorial compartido
Basado en PyTorch
Compatible con Sentence-Transformers
Arquitectura basada en LaBSE

Casos de uso

Similitud de oraciones
Extracción de características
Incorporaciones de texto
Inferencia en múltiples idiomas