silencesys/paraphrase-xlm-r-multilingual-v1-fine-tuned-for-medieval-latin

silencesys
Similitud de oraciones

Este es un modelo de sentence-transformers: mapea oraciones y párrafos a un espacio vectorial denso de 768 dimensiones y puede ser usado para tareas como agrupamiento o búsqueda semántica.

Como usar

Uso (Sentence-Transformers)

Usar este modelo es fácil cuando tienes instalado sentence-transformers: pip install -U sentence-transformers

from sentence_transformers import SentenceTransformer
sentences = ["This is an example sentence", "Each sentence is converted"]

model = SentenceTransformer('silencesys/paraphrase-xlm-r-multilingual-v1-fine-tuned-for-medieval-latin')
embeddings = model.encode(sentences)
print(embeddings)

Uso (HuggingFace Transformers)

Sin sentence-transformers, puedes usar el modelo de esta manera: Primero, pasas tu entrada a través del modelo de transformadores, luego tienes que aplicar la operación de agrupamiento correcta en la parte superior de las incrustaciones de palabras contextualizadas.

from transformers import AutoTokenizer, AutoModel
import torch

def cls_pooling(model_output, attention_mask):
    return model_output[0][:,0]

# Oraciones para las cuales queremos las incrustaciones de sentencias
sentences = ['This is an example sentence', 'Each sentence is converted']

# Cargar modelo desde HuggingFace Hub
tokenizer = AutoTokenizer.from_pretrained('silencesys/paraphrase-xlm-r-multilingual-v1-fine-tuned-for-medieval-latin')
model = AutoModel.from_pretrained('silencesys/paraphrase-xlm-r-multilingual-v1-fine-tuned-for-medieval-latin')

# Tokenizar oraciones
encoded_input = tokenizer(sentences, padding=True, truncation=True, return_tensors='pt')

# Calcular incrustaciones de tokens
with torch.no_grad():
    model_output = model(**encoded_input)

# Realizar agrupamiento. En este caso, agrupamiento cls.
sentence_embeddings = cls_pooling(model_output, encoded_input['attention_mask'])

print("Incrustaciones de oraciones:")
print(sentence_embeddings)

Funcionalidades

similaridad de oraciones
transformadores de oraciones
compatible con PyTorch
compatible con Transformers
extracción de características
compatible con AutoTrain
inferencia de incrustaciones de texto
compatible con Endpoints de Inferencia

Casos de uso

Agrupamiento de oraciones
Búsqueda semántica
Análisis de similitud de texto