use-cmlm-multilingual
sentence-transformers
Similitud de oraciones
Esta es una versión de PyTorch del modelo universal-sentence-encoder-cmlm/multilingual-base-br. Puede usarse para mapear 109 idiomas a un espacio vectorial compartido. Como el modelo se basa en LaBSE, su desempeño es bastante comparable en tareas posteriores.
Como usar
Usar este modelo se vuelve fácil cuando tienes instalado sentence-transformers:
pip install -U sentence-transformers
Luego, puedes usar el modelo así:
from sentence_transformers import SentenceTransformer
sentences = ["This is an example sentence", "Each sentence is converted"]
model = SentenceTransformer('sentence-transformers/use-cmlm-multilingual')
embeddings = model.encode(sentences)
print(embeddings)
Funcionalidades
- Mapeo de 109 idiomas a un espacio vectorial compartido
- Basado en PyTorch
- Compatible con Sentence-Transformers
- Arquitectura basada en LaBSE
Casos de uso
- Similitud de oraciones
- Extracción de características
- Incorporaciones de texto
- Inferencia en múltiples idiomas