silencesys/paraphrase-xlm-r-multilingual-v1-fine-tuned-for-medieval-latin
silencesys
Similitud de oraciones
Este es un modelo de sentence-transformers: mapea oraciones y párrafos a un espacio vectorial denso de 768 dimensiones y puede ser usado para tareas como agrupamiento o búsqueda semántica.
Como usar
Uso (Sentence-Transformers)
Usar este modelo es fácil cuando tienes instalado sentence-transformers:
pip install -U sentence-transformers
from sentence_transformers import SentenceTransformer
sentences = ["This is an example sentence", "Each sentence is converted"]
model = SentenceTransformer('silencesys/paraphrase-xlm-r-multilingual-v1-fine-tuned-for-medieval-latin')
embeddings = model.encode(sentences)
print(embeddings)
Uso (HuggingFace Transformers)
Sin sentence-transformers, puedes usar el modelo de esta manera: Primero, pasas tu entrada a través del modelo de transformadores, luego tienes que aplicar la operación de agrupamiento correcta en la parte superior de las incrustaciones de palabras contextualizadas.
from transformers import AutoTokenizer, AutoModel
import torch
def cls_pooling(model_output, attention_mask):
return model_output[0][:,0]
# Oraciones para las cuales queremos las incrustaciones de sentencias
sentences = ['This is an example sentence', 'Each sentence is converted']
# Cargar modelo desde HuggingFace Hub
tokenizer = AutoTokenizer.from_pretrained('silencesys/paraphrase-xlm-r-multilingual-v1-fine-tuned-for-medieval-latin')
model = AutoModel.from_pretrained('silencesys/paraphrase-xlm-r-multilingual-v1-fine-tuned-for-medieval-latin')
# Tokenizar oraciones
encoded_input = tokenizer(sentences, padding=True, truncation=True, return_tensors='pt')
# Calcular incrustaciones de tokens
with torch.no_grad():
model_output = model(**encoded_input)
# Realizar agrupamiento. En este caso, agrupamiento cls.
sentence_embeddings = cls_pooling(model_output, encoded_input['attention_mask'])
print("Incrustaciones de oraciones:")
print(sentence_embeddings)
Funcionalidades
- similaridad de oraciones
- transformadores de oraciones
- compatible con PyTorch
- compatible con Transformers
- extracción de características
- compatible con AutoTrain
- inferencia de incrustaciones de texto
- compatible con Endpoints de Inferencia
Casos de uso
- Agrupamiento de oraciones
- Búsqueda semántica
- Análisis de similitud de texto